当前位置:主页 > 科技论文 > 软件论文 >

一种适用于高维非线性特征数据的聚类算法及应用

发布时间:2018-07-20 17:14
【摘要】:针对高维数据聚类分析中数据之间具有多种非线性特征关系,导致数据分布不均、传统相似性度量失效及结果类中心难以精准表征等问题,提出了一种基于核主元分析(KPCA)与密度聚类(DBSCAN)的高维非线性特征数据聚类分析技术。首先,为有效提取高维数据的非线性特征,利用KPCA理论将原始数据映射到更高维数据空间,利用主元分析获得数据变化的方向集合,并进行降维分析;然后,通过重新定义数据样本在主元空间的相似性距离对传统DBSCAN聚类方法进行改进,并利用3δ统计理论对各簇中心的进行表征,从而实现高维数据的精确分类与类中心知识表达。以实际高血压患者群体聚类问题为例对方法进行了有效性验证,实验表明,所提方法可以有效获取原始数据的非线性特征,实现患者个体特征群体的有效划分及簇类中心知识的表达,解决传统DBSCAN聚类方法对高维数据不适用的问题。
[Abstract]:In high dimensional data clustering analysis, there are many nonlinear feature relationships between the data, which lead to uneven distribution of data, failure of traditional similarity measurement and difficulty in accurate representation of result class centers, and so on. A high dimensional nonlinear feature data clustering technique based on kernel principal component analysis (KPCA) and density clustering (DBSCAN) is proposed. Firstly, in order to extract the nonlinear features of high-dimensional data effectively, the original data is mapped to higher-dimensional data space by using KPCA theory, and the direction set of data change is obtained by principal component analysis, and then the dimensionality reduction analysis is carried out. The traditional DBSCAN clustering method is improved by redefining the similarity distance of data samples in the principal component space, and each cluster center is represented by using the 3 未 statistical theory to realize the accurate classification of high-dimensional data and the knowledge representation of the cluster center. The validity of the method is verified by taking the cluster problem of real hypertension patients as an example. The experimental results show that the proposed method can effectively obtain the nonlinear characteristics of the original data. In order to solve the problem that traditional DBSCAN clustering method is not applicable to high dimensional data, the effective division of patient individual characteristic groups and the expression of cluster center knowledge are realized.
【作者单位】: 西安交通大学机械制造系统工程国家重点实验室;西安交通大学第二附属医院;
【基金】:国家自然科学基金资助项目(51375375) 中央高校基本科研业务费专项资金资助项目(xjj2014108)
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 肖化昆;;一种高维数据类模板的设计方法与应用[J];计算机科学;2006年08期

2 贺玲;蔡益朝;杨征;;高维数据空间的一种网格划分方法[J];计算机工程与应用;2011年05期

3 何进荣;丁立新;胡庆辉;李照奎;;高维数据空间的性质及度量选择[J];计算机科学;2014年03期

4 刘洪波,王秀坤,赵晶;高维数据空间金字塔技术研究[J];计算机工程与应用;2003年16期

5 沈萍;;高维数据挖掘技术研究[J];电脑知识与技术;2009年06期

6 谢枫平;;聚类分析中的高维数据降维方法研究[J];闽西职业技术学院学报;2009年04期

7 余元辉;邓莹;;一种新的高维数据聚类自适应算法的研究[J];沈阳化工大学学报;2010年02期

8 王寅峰;刘昊;狄盛;胡昊宇;;一种支持高维数据查询的并行索引机制[J];华中科技大学学报(自然科学版);2011年S1期

9 周勇;卢晓伟;程春田;;非规则流中高维数据流典型相关性分析并行计算方法[J];软件学报;2012年05期

10 王素芳;;基于组件的高维数据降维方法研究[J];电脑与电信;2012年10期

相关会议论文 前5条

1 周煜人;彭辉;桂卫华;;基于映射的高维数据聚类方法[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年

2 梁俊杰;杨泽新;冯玉才;;大规模高维数据库索引结构[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

3 陈冠华;马秀莉;杨冬青;唐世渭;帅猛;;面向高维数据的低冗余Top-k异常点发现方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

4 刘运涛;鲍玉斌;吴丹;冷芳玲;孙焕良;于戈;;CBFrag-Cubing:一种基于压缩位图的高维数据立方创建算法(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

5 甘俊英;张有为;;核主元分析特征提取法的研究[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年

相关博士学位论文 前10条

1 黄晓辉;高维数据的若干聚类问题及算法研究[D];哈尔滨工业大学;2015年

2 杨崇;高维数据流上的K近邻问题研究[D];山东大学;2016年

3 徐微微;高维数据降维可视化研究及其在生物医学中的应用[D];武汉大学;2016年

4 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年

5 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年

6 吴庆耀;高维数据的若干分类问题及算法研究[D];哈尔滨工业大学;2013年

7 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年

8 黄健美;高维数据索引及其查询处理技术研究[D];东北大学;2009年

9 董道国;高维数据索引结构研究[D];复旦大学;2005年

10 刘翠响;人脸识别中高维数据特征分析[D];河北工业大学;2008年

相关硕士学位论文 前10条

1 沈江炎;基于软子空间的高维数据树形索引研究[D];昆明理工大学;2015年

2 侯小丽;高维数据聚类中的神经网络降维方法研究[D];兰州大学;2015年

3 何荧;高维数据下的特征选择与聚类方法研究[D];西南大学;2015年

4 胡昌杰;基于Autoencoder的高维数据降维方法研究[D];兰州大学;2015年

5 杨代君;基于进化算法的高维数据聚类研究[D];西安电子科技大学;2014年

6 杨庭庭;基于信息熵的高维数据流聚类及其应用研究[D];重庆交通大学;2015年

7 孙喜利;高维数据的降维及聚类方法研究[D];兰州大学;2016年

8 黄青君;基于稀疏子空间的高维数据聚类关键技术研究与应用[D];电子科技大学;2016年

9 刘建环;面向高维数据降维与分类的深度模型构建方法研究[D];重庆大学;2016年

10 孙志鹏;高维数据聚类算法的研究及应用[D];江南大学;2017年



本文编号:2134201

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2134201.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8a20e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com