多指标面板数据聚类方法研究及其实证分析
发布时间:2022-01-28 02:20
当今世界是一个数据爆炸的大数据时代,随着信息技术的空前发展,海量的数据成为最有价值的财富。聚类作为数据挖掘的一种常用技术手段,广泛应用于数据分析过程的各个环节。面板数据(Panel Data)又称时间序列-截面数据,因兼具多种数据特性而被广泛采用。相较于单一结构的数据,面板数据的特殊数据结构除可提供更多信息外,还能体现数据的动态性。聚类的两个关键步骤在于样本相似度的表征及聚类算法的选择,面板数据三维结构的动态性和复杂性导致聚类过程中样本间与类间的相似性均难以测度。基于此背景,本文从相似性统计量设计角度入手研究,提出了两种适用于多指标面板数据的聚类方法,实证结果显示两种方法都能有效地完成对研究对象的聚类,且对面板数据的特征提取角度各有侧重。本文的研究内容可概括为如下几个方面:(1)概述了面板数据聚类方法的研究背景、发展历程及研究现状,总结了现有方法中存在的一些不足之处及可优化的地方,并在此基础上给出了本文的研究内容、创新点及技术路线。(2)剖析了面板数据的结构,详细地阐述了面板数据聚类模型构建过程中涉及到的数据处理方法原理及计算步骤,具体方法包括主成分分析法、熵权法、时间序列数据的符号化...
【文章来源】:桂林理工大学广西壮族自治区
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
实证分析数据处理路线图
桂林理工大学硕士学位论文37图5.1基于综合趋势距离的聚类树形图综合考虑碎石图和实际研究问题背景,聚类数目选六个较为合适,聚类结果见表5.9。表5.9基于综合趋势距离的34个地区聚类结果类别地区数量第一类西藏自治区1第二类吉林盛江西盛甘肃盛河北盛宁夏回族自治区、山西盛黑龙江盛河南盛贵州盛青海盛新疆维吾尔自治区11第三类辽宁省1第四类天津市、福建盛江苏盛重庆市4第五类北京市、浙江盛广东盛上海市4第六类内蒙古自治区、山东盛安徽盛湖北盛陕西盛海南盛湖南盛四川盛广西壮族自治区、云南省10聚类分析本身是一种无监督的学习过程。为验证聚类结果的合理性,利用MATLAB软件编写绘图程序绘制出各类地区的综合得分趋势图,见图5.2。
桂林理工大学硕士学位论文38图5.2基于综合趋势距离的2002-2012年各类地区的综合得分趋势图5.1.5基于欧式距离的面板数据聚类结果通过欧氏距离计算省际间的距离矩阵,为保证对比的客观性同样用ward法完成聚类,聚类结果见表5.10。表5.10基于欧氏距离的31个地区聚类结果类别地区数量第一类西藏自治区1第二类内蒙古自治区、山东盛安徽盛辽宁盛湖北盛陕西盛海南盛湖南盛四川盛广西壮族自治区、云南省11第三类上海市1第四类北京市、浙江盛广东盛3第五类吉林盛江西盛甘肃盛河北盛宁夏回族自治区、山西盛黑龙江盛河南盛贵州盛青海盛新疆维吾尔自治区11第六类天津市、福建盛江苏盛重庆市4根据聚类结果可绘制出的基于欧氏距离的综合得分趋势图,见图5.3。
【参考文献】:
期刊论文
[1]基于小波特征提取的高频面板数据聚类方法[J]. 戴大洋,邓光明. 统计与信息论坛. 2018(02)
[2]基于灰关联度的面板数据聚类方法及在空气污染分析中的应用[J]. 党耀国,朱晓月,丁松,王俊杰. 控制与决策. 2017(12)
[3]面板数据加权聚类分析方法研究[J]. 张立军,彭浩. 统计与信息论坛. 2017(04)
[4]基于数值符号和形态特征的时间序列相似性度量方法[J]. 李海林,梁叶. 控制与决策. 2017(03)
[5]非线性面板数据聚类方法研究[J]. 孙艳,黄咏宁. 统计与信息论坛. 2017(02)
[6]多元时间序列相似性度量方法[J]. 李正欣,郭建胜,毛红保,高杨军. 控制与决策. 2017(02)
[7]基于动态时间规整的面板数据聚类方法研究及应用[J]. 刘云霞. 统计研究. 2016(11)
[8]基于特征提取的多指标面板数据聚类方法[J]. 党耀国,侯荻青. 统计与决策. 2016(19)
[9]面板数据的灰色矩阵相似关联模型及其应用[J]. 崔立志,刘思峰. 中国管理科学. 2015(11)
[10]面板数据下的灰色指标关联聚类模型与应用[J]. 李雪梅,党耀国,王俊杰. 控制与决策. 2015(08)
硕士论文
[1]房地产投资与经济波动的相互影响问题研究[D]. 刘章生.江西师范大学 2012
[2]面板数据的灰色聚类方法研究及应用[D]. 赵洁珏.南京航空航天大学 2012
[3]面板数据的灰色关联与聚类模型构建及应用[D]. 穆森.南京航空航天大学 2012
本文编号:3613506
【文章来源】:桂林理工大学广西壮族自治区
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
实证分析数据处理路线图
桂林理工大学硕士学位论文37图5.1基于综合趋势距离的聚类树形图综合考虑碎石图和实际研究问题背景,聚类数目选六个较为合适,聚类结果见表5.9。表5.9基于综合趋势距离的34个地区聚类结果类别地区数量第一类西藏自治区1第二类吉林盛江西盛甘肃盛河北盛宁夏回族自治区、山西盛黑龙江盛河南盛贵州盛青海盛新疆维吾尔自治区11第三类辽宁省1第四类天津市、福建盛江苏盛重庆市4第五类北京市、浙江盛广东盛上海市4第六类内蒙古自治区、山东盛安徽盛湖北盛陕西盛海南盛湖南盛四川盛广西壮族自治区、云南省10聚类分析本身是一种无监督的学习过程。为验证聚类结果的合理性,利用MATLAB软件编写绘图程序绘制出各类地区的综合得分趋势图,见图5.2。
桂林理工大学硕士学位论文38图5.2基于综合趋势距离的2002-2012年各类地区的综合得分趋势图5.1.5基于欧式距离的面板数据聚类结果通过欧氏距离计算省际间的距离矩阵,为保证对比的客观性同样用ward法完成聚类,聚类结果见表5.10。表5.10基于欧氏距离的31个地区聚类结果类别地区数量第一类西藏自治区1第二类内蒙古自治区、山东盛安徽盛辽宁盛湖北盛陕西盛海南盛湖南盛四川盛广西壮族自治区、云南省11第三类上海市1第四类北京市、浙江盛广东盛3第五类吉林盛江西盛甘肃盛河北盛宁夏回族自治区、山西盛黑龙江盛河南盛贵州盛青海盛新疆维吾尔自治区11第六类天津市、福建盛江苏盛重庆市4根据聚类结果可绘制出的基于欧氏距离的综合得分趋势图,见图5.3。
【参考文献】:
期刊论文
[1]基于小波特征提取的高频面板数据聚类方法[J]. 戴大洋,邓光明. 统计与信息论坛. 2018(02)
[2]基于灰关联度的面板数据聚类方法及在空气污染分析中的应用[J]. 党耀国,朱晓月,丁松,王俊杰. 控制与决策. 2017(12)
[3]面板数据加权聚类分析方法研究[J]. 张立军,彭浩. 统计与信息论坛. 2017(04)
[4]基于数值符号和形态特征的时间序列相似性度量方法[J]. 李海林,梁叶. 控制与决策. 2017(03)
[5]非线性面板数据聚类方法研究[J]. 孙艳,黄咏宁. 统计与信息论坛. 2017(02)
[6]多元时间序列相似性度量方法[J]. 李正欣,郭建胜,毛红保,高杨军. 控制与决策. 2017(02)
[7]基于动态时间规整的面板数据聚类方法研究及应用[J]. 刘云霞. 统计研究. 2016(11)
[8]基于特征提取的多指标面板数据聚类方法[J]. 党耀国,侯荻青. 统计与决策. 2016(19)
[9]面板数据的灰色矩阵相似关联模型及其应用[J]. 崔立志,刘思峰. 中国管理科学. 2015(11)
[10]面板数据下的灰色指标关联聚类模型与应用[J]. 李雪梅,党耀国,王俊杰. 控制与决策. 2015(08)
硕士论文
[1]房地产投资与经济波动的相互影响问题研究[D]. 刘章生.江西师范大学 2012
[2]面板数据的灰色聚类方法研究及应用[D]. 赵洁珏.南京航空航天大学 2012
[3]面板数据的灰色关联与聚类模型构建及应用[D]. 穆森.南京航空航天大学 2012
本文编号:3613506
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3613506.html