基于特征提取的多指标面板数据聚类方法
发布时间:2018-01-05 07:23
本文关键词:基于特征提取的多指标面板数据聚类方法 出处:《统计与决策》2016年19期 论文类型:期刊论文
【摘要】:多指标面板数据能够较全面的提供研究对象的信息和数据特征,但复杂的数据结构也给其聚类分析带来了一定的困难。针对这一问题,文章提出了基于特征提取的多指标面板数据聚类方法,该方法将能够表征面板数据动态变化的"绝对量"特征、"波动"特征、"偏度"特征、"峰度"特征及"趋势"特征引入动态聚类算法中,可以避免以往采用欧式距离进行聚类的局限性,还可以处理带有缺失数据的面板数据,同时大大提高了聚类效率,并最大限度地保证时间维度信息不受损失。利用该方法分析了2001至2013年我国不同省份道路交通事故的不平衡状况,通过实证分析表明该方法能够解决多指标面板数据聚类的问题。
[Abstract]:Multi-index panel data can provide more comprehensive information and data features of the research object, but the complex data structure also brings some difficulties to its clustering analysis. In this paper, a multi-index panel data clustering method based on feature extraction is proposed, which can represent the features of "absolute quantity", "fluctuation" and "bias" of the dynamic change of panel data. "kurtosis" feature and "trend" feature are introduced into dynamic clustering algorithm, which can avoid the limitation of using Euclidean distance to cluster in the past, and can also deal with panel data with missing data. At the same time, the clustering efficiency is greatly improved, and the time dimension information is guaranteed to be free from loss to the maximum extent. Using this method, the unbalanced situation of road traffic accidents in different provinces of China from 2001 to 2013 is analyzed. The empirical analysis shows that this method can solve the problem of multi-index panel data clustering.
【作者单位】: 南京航空航天大学经济与管理学院;
【基金】:国家自然科学基金资助项目(71071077,71371098) 中央高校基本科研业务费专项资金资助项目(NC2012001) 南京航空航天大学基本科研业务费专项科研资助项目(NZ2010006)
【分类号】:F224
【正文快照】: 0 引言 面板数据又称时间序列截面数据或混合数据,是由不同个体在多个时期上观测得到的数据,它综合了时间序列与截面数据的特征,能够描述研究对象的动态特征,在经济与管理问题的建模与分析中具有重要的地位。面板数据的聚类分析是指依据不同指标的观测数据,把数据划分为若干
【相似文献】
相关期刊论文 前1条
1 蒋辉;张波;;支持向量回归特征提取的ARMA准则——中国社会消费品零售总额预测的实证研究[J];统计与信息论坛;2012年07期
,本文编号:1382130
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/1382130.html