当前位置:主页 > 科技论文 > 软件论文 >

基于稀疏聚类的高维数据特征选择及应用

发布时间:2018-07-15 07:58
【摘要】:文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用。将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标。
[Abstract]:This paper studies a method of selecting high dimensional data clustering feature - Sparse Clustering. Sparse clustering is by giving weight to characteristic variables, adding lasso penalty factor and compressing weight, getting weight sorting of variables, that is, importance sorting, so that it can eliminate redundant variables automatically at the same time of classification prediction. This method is applied to the environmental protection problem in China, and the 31 provinces in China are divided into 3 categories according to the environmental protection situation, and 20 important indicators are selected from the existing 104 environmental protection indicators.
【作者单位】: 中国人民大学应用统计科学研究中心;中国人民大学统计学院;新疆财经大学新疆社会经济统计研究中心;新疆财经大学统计与信息学院;兰州财经大学统计学院;
【基金】:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目(15XNL008)
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 贺玲;蔡益朝;杨征;;高维数据空间的一种网格划分方法[J];计算机工程与应用;2011年05期

2 李郁林;;高维数据分析中的降维研究[J];计算机光盘软件与应用;2012年17期

3 何进荣;丁立新;胡庆辉;李照奎;;高维数据空间的性质及度量选择[J];计算机科学;2014年03期

4 刘洪波,王秀坤,赵晶;高维数据空间金字塔技术研究[J];计算机工程与应用;2003年16期

5 沈萍;;高维数据挖掘技术研究[J];电脑知识与技术;2009年06期

6 谢枫平;;聚类分析中的高维数据降维方法研究[J];闽西职业技术学院学报;2009年04期

7 余元辉;邓莹;;一种新的高维数据聚类自适应算法的研究[J];沈阳化工大学学报;2010年02期

8 王寅峰;刘昊;狄盛;胡昊宇;;一种支持高维数据查询的并行索引机制[J];华中科技大学学报(自然科学版);2011年S1期

9 周勇;卢晓伟;程春田;;非规则流中高维数据流典型相关性分析并行计算方法[J];软件学报;2012年05期

10 王素芳;;基于组件的高维数据降维方法研究[J];电脑与电信;2012年10期

相关会议论文 前6条

1 周煜人;彭辉;桂卫华;;基于映射的高维数据聚类方法[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年

2 梁俊杰;杨泽新;冯玉才;;大规模高维数据库索引结构[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

3 陈冠华;马秀莉;杨冬青;唐世渭;帅猛;;面向高维数据的低冗余Top-k异常点发现方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

4 刘运涛;鲍玉斌;吴丹;冷芳玲;孙焕良;于戈;;CBFrag-Cubing:一种基于压缩位图的高维数据立方创建算法(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

5 刘文慧;;PCA与PLS用于高维数据分类的比较性研究[A];2011年中国卫生统计学年会会议论文集[C];2011年

6 刘喜兰;冯德益;王公恕;朱成喜;冯雯;;脸谱分析在中进期地震跟踪预报中的应用[A];中国地震学会第四次学术大会论文摘要集[C];1992年

相关重要报纸文章 前1条

1 本报记者 李双艺;引领高维数据分析先河[N];吉林日报;2013年

相关博士学位论文 前10条

1 刘胜蓝;余弦度量下的高维数据降维及分类方法研究[D];大连理工大学;2015年

2 黄晓辉;高维数据的若干聚类问题及算法研究[D];哈尔滨工业大学;2015年

3 杨崇;高维数据流上的K近邻问题研究[D];山东大学;2016年

4 路梅;面向高维数据的特征学习理论与应用研究[D];苏州大学;2016年

5 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年

6 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年

7 吴庆耀;高维数据的若干分类问题及算法研究[D];哈尔滨工业大学;2013年

8 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年

9 黄健美;高维数据索引及其查询处理技术研究[D];东北大学;2009年

10 任亚洲;高维数据上的聚类方法研究[D];华南理工大学;2014年

相关硕士学位论文 前10条

1 沈江炎;基于软子空间的高维数据树形索引研究[D];昆明理工大学;2015年

2 侯小丽;高维数据聚类中的神经网络降维方法研究[D];兰州大学;2015年

3 赵俊琴;基于Lasso的高维数据线性回归模型统计推断方法比较[D];山西医科大学;2015年

4 何荧;高维数据下的特征选择与聚类方法研究[D];西南大学;2015年

5 胡昌杰;基于Autoencoder的高维数据降维方法研究[D];兰州大学;2015年

6 杨代君;基于进化算法的高维数据聚类研究[D];西安电子科技大学;2014年

7 王宏霞;交通高维数据逻辑整合与降解研究[D];重庆交通大学;2015年

8 杨庭庭;基于信息熵的高维数据流聚类及其应用研究[D];重庆交通大学;2015年

9 孙喜利;高维数据的降维及聚类方法研究[D];兰州大学;2016年

10 吴佳妮;基于SVM的质谱细胞仪高维数据分析在AML早期诊断方面的应用研究[D];山东大学;2016年



本文编号:2123397

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2123397.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户71719***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com