当前位置:主页 > 科技论文 > 软件论文 >

针对多聚类中心大数据集的加速K-means聚类算法

发布时间:2017-10-23 20:03

  本文关键词:针对多聚类中心大数据集的加速K-means聚类算法


  更多相关文章: DIACK 加速K-means 聚类 三角定理


【摘要】:随着数据量、数据维度呈指数发展以及实际应用中聚类中心个数的增多,传统的K-means聚类算法已经不能满足实际应用中的时间和内存要求。针对该问题提出了一种基于动态类中心调整和Elkan三角判定思想的加速K-means聚类算法。实验结果证明,当数据规模达到10万条,聚类个数达到20个以上时,本算法相比Elkan算法具有更快的收敛速度和更低的内存开销。
【作者单位】: 中国科学院沈阳自动化研究所;中国科学院大学;吉化集团吉林市软信技术有限公司;
【关键词】DIACK 加速K-means 聚类 三角定理
【基金】:国家科技支持计划资助项目(2012BAH15F05) 吉林省科技型中小企业技术创新基金资助项目(12C26212201399) 国家自然科学基金资助项目(612033161,51205389)
【分类号】:TP311.13
【正文快照】: 0引言聚类是一种典型的数据挖掘方法,在识别数据内部结构方面有重要的作用。Mac Queen[1]在1967年提出的K-means算法是最经典的聚类算法,其目标是将数据集划分成多个类,使类中各点的相似性尽可能大而类间的相似性尽可能小。由于其方法简单,对球状类有很好的聚类效果,在图像处

【相似文献】

中国期刊全文数据库 前10条

1 黄旭;吕强;钱培德;;一种用于蛋白质结构聚类的聚类中心选择算法[J];自动化学报;2011年06期

2 樊晓光;路钊;王久崇;李国栋;谢朝政;;基于密度和距离积的聚类中心选取方法[J];测控技术;2013年10期

3 赵峰;张军英;刘敬;;核最优变换与聚类中心的算法[J];西安电子科技大学学报;2009年01期

4 朱云贺;张春海;张博;;基于数据分段的K-means的优化研究[J];计算机技术与发展;2010年11期

5 李春生;王耀南;;聚类中心初始化的新方法[J];控制理论与应用;2010年10期

6 陈侃;李彬;田联房;;基于局部阈值和聚类中心迭代的肺结节检测算法[J];计算机科学;2012年02期

7 关学忠,韩彩霞,韩振洲;神经模糊系统中模糊规则的优化[J];大庆石油学院学报;2005年01期

8 刘舒野;林和平;杨晨;;基于归并聚类中心思想的模糊聚类分析方法研究[J];航空计算技术;2007年04期

9 宁永恒;杨小兵;王康健;;一种多聚类中心的划分方法[J];中国计量学院学报;2014年02期

10 高潮;田翠翠;郭永彩;;基于改进聚类中心分析法的红外行人分割[J];计算机工程;2011年06期

中国重要会议论文全文数据库 前1条

1 吴继兵;李心科;;基于K-最近邻居图划分的聚类中心初始化算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

中国硕士学位论文全文数据库 前2条

1 徐祥;多中心聚类算法的研究与改进[D];安徽大学;2015年

2 邱荣太;基于Hadoop平台的Map-Reduce应用研究[D];河南理工大学;2009年



本文编号:1085102

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1085102.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a1978***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com