一种适用于高维非线性特征数据的聚类算法及应用
[Abstract]:In high dimensional data clustering analysis, there are many nonlinear feature relationships between the data, which lead to uneven distribution of data, failure of traditional similarity measurement and difficulty in accurate representation of result class centers, and so on. A high dimensional nonlinear feature data clustering technique based on kernel principal component analysis (KPCA) and density clustering (DBSCAN) is proposed. Firstly, in order to extract the nonlinear features of high-dimensional data effectively, the original data is mapped to higher-dimensional data space by using KPCA theory, and the direction set of data change is obtained by principal component analysis, and then the dimensionality reduction analysis is carried out. The traditional DBSCAN clustering method is improved by redefining the similarity distance of data samples in the principal component space, and each cluster center is represented by using the 3 未 statistical theory to realize the accurate classification of high-dimensional data and the knowledge representation of the cluster center. The validity of the method is verified by taking the cluster problem of real hypertension patients as an example. The experimental results show that the proposed method can effectively obtain the nonlinear characteristics of the original data. In order to solve the problem that traditional DBSCAN clustering method is not applicable to high dimensional data, the effective division of patient individual characteristic groups and the expression of cluster center knowledge are realized.
【作者单位】: 西安交通大学机械制造系统工程国家重点实验室;西安交通大学第二附属医院;
【基金】:国家自然科学基金资助项目(51375375) 中央高校基本科研业务费专项资金资助项目(xjj2014108)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 肖化昆;;一种高维数据类模板的设计方法与应用[J];计算机科学;2006年08期
2 贺玲;蔡益朝;杨征;;高维数据空间的一种网格划分方法[J];计算机工程与应用;2011年05期
3 何进荣;丁立新;胡庆辉;李照奎;;高维数据空间的性质及度量选择[J];计算机科学;2014年03期
4 刘洪波,王秀坤,赵晶;高维数据空间金字塔技术研究[J];计算机工程与应用;2003年16期
5 沈萍;;高维数据挖掘技术研究[J];电脑知识与技术;2009年06期
6 谢枫平;;聚类分析中的高维数据降维方法研究[J];闽西职业技术学院学报;2009年04期
7 余元辉;邓莹;;一种新的高维数据聚类自适应算法的研究[J];沈阳化工大学学报;2010年02期
8 王寅峰;刘昊;狄盛;胡昊宇;;一种支持高维数据查询的并行索引机制[J];华中科技大学学报(自然科学版);2011年S1期
9 周勇;卢晓伟;程春田;;非规则流中高维数据流典型相关性分析并行计算方法[J];软件学报;2012年05期
10 王素芳;;基于组件的高维数据降维方法研究[J];电脑与电信;2012年10期
相关会议论文 前5条
1 周煜人;彭辉;桂卫华;;基于映射的高维数据聚类方法[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年
2 梁俊杰;杨泽新;冯玉才;;大规模高维数据库索引结构[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 陈冠华;马秀莉;杨冬青;唐世渭;帅猛;;面向高维数据的低冗余Top-k异常点发现方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 刘运涛;鲍玉斌;吴丹;冷芳玲;孙焕良;于戈;;CBFrag-Cubing:一种基于压缩位图的高维数据立方创建算法(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 甘俊英;张有为;;核主元分析特征提取法的研究[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
相关博士学位论文 前10条
1 黄晓辉;高维数据的若干聚类问题及算法研究[D];哈尔滨工业大学;2015年
2 杨崇;高维数据流上的K近邻问题研究[D];山东大学;2016年
3 徐微微;高维数据降维可视化研究及其在生物医学中的应用[D];武汉大学;2016年
4 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
5 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
6 吴庆耀;高维数据的若干分类问题及算法研究[D];哈尔滨工业大学;2013年
7 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年
8 黄健美;高维数据索引及其查询处理技术研究[D];东北大学;2009年
9 董道国;高维数据索引结构研究[D];复旦大学;2005年
10 刘翠响;人脸识别中高维数据特征分析[D];河北工业大学;2008年
相关硕士学位论文 前10条
1 沈江炎;基于软子空间的高维数据树形索引研究[D];昆明理工大学;2015年
2 侯小丽;高维数据聚类中的神经网络降维方法研究[D];兰州大学;2015年
3 何荧;高维数据下的特征选择与聚类方法研究[D];西南大学;2015年
4 胡昌杰;基于Autoencoder的高维数据降维方法研究[D];兰州大学;2015年
5 杨代君;基于进化算法的高维数据聚类研究[D];西安电子科技大学;2014年
6 杨庭庭;基于信息熵的高维数据流聚类及其应用研究[D];重庆交通大学;2015年
7 孙喜利;高维数据的降维及聚类方法研究[D];兰州大学;2016年
8 黄青君;基于稀疏子空间的高维数据聚类关键技术研究与应用[D];电子科技大学;2016年
9 刘建环;面向高维数据降维与分类的深度模型构建方法研究[D];重庆大学;2016年
10 孙志鹏;高维数据聚类算法的研究及应用[D];江南大学;2017年
,本文编号:2134201
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2134201.html