K近邻优化的密度峰值快速搜索聚类算法
本文关键词:K近邻优化的密度峰值快速搜索聚类算法,由笔耕文化传播整理发布。
【摘要】:针对2014年6月发表在Science的密度峰值点快速搜索聚类算法的样本局部密度定义和样本分配策略的缺陷,提出一种基于K近邻的快速密度峰值搜索并高效分配样本的聚类算法.算法利用样本点的K近邻信息定义样本局部密度,搜索和发现样本的密度峰值,以峰值点样本作为初始类簇中心;提出两种基于K近邻的样本分配策略,依次分配样本到相应类簇中心,得到数据集样本的分布模式.理论分析和在经典人工数据集、UCI数据集及Olivetti人脸数据集的对比实验表明:提出的基于K近邻的密度峰值搜索聚类算法能快速发现任意形状、任意维度和任意规模数据集的类簇中心,并合理分配样本到相应类簇,揭示数据集样本的分布模式,对噪声数据具有非常好的鲁棒性,聚类结果优于2014年6月发表在Science的密度峰值点快速搜索聚类算法,以及经典聚类算法AP,DBSCAN和K-means.本文算法是一种非常有效的聚类算法,可用于发现任意数据集的隐藏模式与规律.
【作者单位】: 陕西师范大学计算机科学学院;深圳大学信息工程学院ATR国家重点实验室;
【关键词】: K近邻 局部密度 密度峰值 类簇中心 聚类
【基金】:国家自然科学基金项目(批准号:31372250) 陕西省科技攻关项目(批准号:2013K12-03-24) 中央高校基本科研业务费专项基金项目(批准号:GK201503067)资助
【分类号】:TP311.13
【正文快照】: 国家自然科学基金项目(批准号:31372250)、陕西省科技攻关项目(批准号:2013K12-03-24)和中央高校基本科研业务费专项基金项目(批准号:GK201503067)资助1引言聚类是根据数据对象(样本)之间的相似性将数据集样本划分成合理类簇的过程,聚类结果使得同一类簇内的对象具有较高相似
【相似文献】
中国期刊全文数据库 前10条
1 冯舜玺;;新书推荐:《算法分析导论》[J];计算机教育;2006年05期
2 张力,慕晓冬;计算机算法分析浅谈[J];武警工程学院学报;2002年04期
3 马安光;;飞弹问题的算法分析——2003年第10期题解[J];程序员;2003年12期
4 苏运霖;;《算法分析导论》评介[J];计算机教育;2006年07期
5 朱力强;;培养学生创新思维与能力的算法分析案例[J];计算机与信息技术;2007年11期
6 汪菊琴;;几种常见特殊方阵的算法分析与实现[J];无锡职业技术学院学报;2009年05期
7 李涵;;“算法分析与设计”课程教学改革和实践[J];中国电力教育;2010年16期
8 刘宁;管涛;;浅析案例教学法在算法分析与设计课程中的应用[J];科技风;2011年07期
9 胡峰;王国胤;;“算法分析与设计”教学模式探索[J];当代教育理论与实践;2011年12期
10 赵娟;;浅析启发式教学法在《算法分析与设计》课程中的应用[J];福建电脑;2012年06期
中国重要会议论文全文数据库 前10条
1 俞洋;田亚菲;;一种新的变步长LMS算法及其仿真[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
2 周颢;刘振华;赵保华;;构造型的D~2FA生成算法[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
3 赖桃桃;冯少荣;张东站;;一种基于划分和密度的快速聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 刘远新;邓飞其;罗艳辉;舒添慧;;ERP柔性平台下物流运输配送系统算法分析[A];第二十六届中国控制会议论文集[C];2007年
5 王树西;白硕;姜吉发;;模式合一的“减首去尾”算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 王万青;张晓辉;;改进的A~*算法的高效实现[A];2009全国测绘科技信息交流会暨首届测绘博客征文颁奖论文集[C];2009年
7 孙焕良;邱菲;刘俊岭;朱叶丽;;IncSNN——一种基于密度的增量聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 韩建民;岑婷婷;于娟;;实现敏感属性l-多样性的l-MDAV算法[A];第二十七届中国控制会议论文集[C];2008年
9 张悦;尤枫;赵瑞莲;;利用蚁群算法实现基于程序结构的主变元分析[A];第五届中国测试学术会议论文集[C];2008年
10 王旭东;刘渝;邓振淼;;正弦波频率估计的修正Rife算法及其FPGA实现[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年
中国重要报纸全文数据库 前1条
1 科文;VIXD算法分析Web异常[N];中国计算机报;2008年
中国博士学位论文全文数据库 前10条
1 魏哲学;样本断点距离问题的算法与复杂性研究[D];山东大学;2015年
2 刘春明;基于增强学习和车辆动力学的高速公路自主驾驶研究[D];国防科学技术大学;2014年
3 刘新旺;多核学习算法研究[D];国防科学技术大学;2013年
4 于滨;城市公交系统模型与算法研究[D];大连理工大学;2006年
5 曾国强;改进的极值优化算法及其在组合优化问题中的应用研究[D];浙江大学;2011年
6 肖永豪;蜂群算法及在图像处理中的应用研究[D];华南理工大学;2011年
7 陈耿;面向中观审计的规则发现算法研究[D];东南大学;2005年
8 王维博;粒子群优化算法研究及其应用[D];西南交通大学;2012年
9 鱼亮;蛋白质网络模块结构识别算法研究[D];西安电子科技大学;2011年
10 李玉英;混沌蚂蚁群优化算法及其应用研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 黄厦;基于改进蚁群算法的柔性作业车间调度问题研究[D];昆明理工大学;2015年
2 李平;基于Hadoop的信息爬取与舆情检测算法研究[D];昆明理工大学;2015年
3 赵官宝;基于位表的关联规则挖掘算法研究[D];昆明理工大学;2015年
4 殷文华;移动容迟网络中基于社会感知的多播分发算法研究[D];内蒙古大学;2015年
5 徐翔燕;人工鱼群优化算法及其应用研究[D];西南交通大学;2015年
6 李德福;基于小世界模型的启发式寻路算法研究[D];华中师范大学;2015年
7 郑海彬;一种面向MAPREDUCE的DATASHUFFLE的优化方法[D];苏州大学;2015年
8 赵晓寒;轮换步长PSO算法及SMVSC参数优化[D];沈阳理工大学;2015年
9 安丰洋;基于无线网络的广播算法研究[D];曲阜师范大学;2015年
10 李智明;基于改进FastICA算法的混合语音盲分离[D];上海交通大学;2015年
本文关键词:K近邻优化的密度峰值快速搜索聚类算法,,由笔耕文化传播整理发布。
本文编号:505877
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/505877.html