当前位置:主页 > 科技论文 > 自动化论文 >

基于MPI蜂群K均值聚类算法并行化计算

发布时间:2018-01-21 21:27

  本文关键词: 人工蜂群算法 K均值聚类 MPI并行编程 并行计算 大数据 出处:《计算机工程与设计》2017年12期  论文类型:期刊论文


【摘要】:基于传统编程模型的K均值聚类算法是典型的串行算法,对大数据聚类时性能不佳,为获得令人满意的大数据聚类性能要求,解决K均值聚类算法的固有不足,提出一个基于MPI的蜂群K均值进行并行化聚类的算法。结合改进的蜂群算法和K均值迭代,使算法的全局寻优能力得到提高,降低初始聚类中心对算法聚类质量的影响,对该算法做MPI并行化改进,实现基于MPI的蜂群聚类算法并行计算。通过对串行与并行蜂群K均值聚类算法分别进行仿真实验验证,得到了并行蜂群K均值聚类算法在效率和性能上更优的结论。
[Abstract]:The K-means clustering algorithm based on traditional programming model is a typical serial algorithm, which has poor performance for big data clustering. In order to obtain satisfactory big data clustering performance requirements, the inherent shortcomings of K-means clustering algorithm are solved. A parallel clustering algorithm based on MPI for colony K-means is proposed, which combines the improved swarm algorithm and K-means iteration to improve the global optimization ability of the algorithm. The effect of the initial clustering center on the clustering quality is reduced, and the algorithm is improved by MPI parallelization. The parallel computing of the cluster algorithm based on MPI is realized. The simulation results of the serial and parallel K-means clustering algorithms are verified by simulation. It is concluded that the parallel K-means clustering algorithm is better in efficiency and performance.
【作者单位】: 广西经济管理干部学院计算机系;
【基金】:国家社会科学基金项目(15XTQ010) 广西高校科学技术研究基金项目(KY2015YB351) 广西经济管理干部学院科研启动费基金项目 国家自然科学基金项目(61364020)
【分类号】:TP18;TP311.13
【正文快照】: 0引言在数据挖掘领域里广泛应用的K-means算法是聚类的经典算法。但是它本身有3个固有的缺点:(1)过于依赖初始解,当初始解不同时聚类结果也可能不同;(2)搜索是用梯度下降法,经常极易收敛到局部最优;(3)聚类对象是大数据时,K-means算法无法满足性能需求。针对K-means的固有不足

【相似文献】

相关期刊论文 前10条

1 苏清华;胡中波;;基于差分演化的K-均值聚类算法[J];武汉理工大学学报;2010年01期

2 曹易;张宁;;一种改进的模糊C-均值聚类算法[J];上海理工大学学报;2012年04期

3 王圆妹;;一种改进的K-均值聚类算法的研究[J];长江大学学报(自科版);2006年10期

4 王圆妹;;一种改进的K-均值聚类算法的研究[J];长江大学学报(自科版)理工卷;2006年04期

5 刘韬;蔡淑琴;曹丰文;崔志磊;;基于距离浓度的K-均值聚类算法[J];华中科技大学学报(自然科学版);2007年10期

6 查成东;王长松;巩宪锋;周家新;;基于改进K-均值聚类算法的背景提取方法[J];计算机工程与设计;2007年21期

7 王丹丹;李彬;陈武凡;;基于多目标规划的模糊C均值聚类算法[J];中国图象图形学报;2008年08期

8 俞云霞;王士同;朱嵬鹏;;具有数据容错能力的模糊C均值聚类算法[J];计算机工程与设计;2010年03期

9 李翠霞;谭营军;;一种新的模糊C均值聚类算法[J];河南大学学报(自然科学版);2011年02期

10 关庆;邓赵红;王士同;;改进的模糊C-均值聚类算法[J];计算机工程与应用;2011年10期

相关会议论文 前5条

1 孙广玲;唐降龙;;一种快速k-均值聚类算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年

2 陈晓山;朱建冲;翁辉;;一种改进的模糊C均值聚类算法及其应用[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

3 葛继科;余建桥;张帆;张蕊;;改进的K-均值聚类算法[A];’2004计算机应用技术交流会议论文集[C];2004年

4 刘健庄;谢维信;;一种改进的快速模糊C均值聚类算法[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年

5 罗小刚;彭承琳;刘婷;侯长军;霍丹群;文利;;基于模糊C均值聚类算法的心脏扭转运动中心室壁轮廓的自动提取[A];中国仪器仪表学会医疗仪器分会第四次全国会员代表大会暨2009年学术年会论文集[C];2009年

相关硕士学位论文 前10条

1 刘莉莉;K-均值聚类算法的研究与改进[D];曲阜师范大学;2015年

2 王龙强;K均值聚类算法初始聚类中心的选取与改进[D];东北大学;2013年

3 梁鹏;基于Spark的模糊c均值聚类算法研究[D];哈尔滨工业大学;2015年

4 徐曼舒;基于改进人工蜂群的模糊C均值聚类算法研究[D];安徽大学;2016年

5 古哲德;无线传感器网络中面向图像的模糊C均值聚类算法的研究[D];广西大学;2016年

6 崔西希;基于中智模糊C-均值聚类算法及其应用研究[D];西安邮电大学;2017年

7 吴晓蓉;K-均值聚类算法初始中心选取相关问题的研究[D];湖南大学;2008年

8 赵爽;改进的模糊C均值聚类算法及其应用[D];东北大学;2010年

9 欧陈委;K-均值聚类算法的研究与改进[D];长沙理工大学;2011年

10 王威娜;改进的模糊C-均值聚类算法[D];大连海事大学;2007年



本文编号:1452573

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1452573.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户13dd9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com