基于MapReduce的FCM聚类集成算法
本文关键词:基于MapReduce的FCM聚类集成算法
更多相关文章: MapReduce 聚类集成 模糊C-均值 并行聚类算法
【摘要】:模糊C-均值(FCM)聚类集成算法是一种利用集成思想提高聚类质量的方法。针对FCM聚类集成算法随着数据量的增加时间复杂度过高的问题,提出一种基于MapReduce框架的并行FCM聚类集成算法。首先利用多组随机的初始聚类中心分别进行聚类来获取具有差异化的聚类成员;然后通过建立聚类成员簇间OVERLAP矩阵来寻找逻辑等价簇,统一所有聚类成员中的簇标记;最后利用投票法共享聚类成员中数据对象的聚类情况得出最终的聚类结果。实验结果表明,该算法具有良好的精确度、加速比和扩展性,具有处理较大规模数据集的能力。
【作者单位】: 解放军信息工程大学密码工程学院;
【关键词】: MapReduce 聚类集成 模糊C-均值 并行聚类算法
【分类号】:TP311.13
【正文快照】: 0引言聚类就是将事物按照某种规则划分成若干个簇,使同一个簇中的元素尽可能地相似,不同簇中的元素尽可能地不同,已广泛地应用于数据挖掘、信息检索、图像识别等领域[1]。作为一种非监督的学习方法,聚类一直以来都是机器学习研究领域的热点。目前,主流的聚类算法可根据聚类思
【相似文献】
中国期刊全文数据库 前10条
1 罗建宏;陈德钊;;兼顾正确率和差异性的自适应集成算法及应用[J];浙江大学学报(工学版);2011年03期
2 王芳;杨慧中;;一种改进的支持向量回归集成算法[J];计算机工程与应用;2008年03期
3 盛高斌;姚明海;;基于半监督回归的选择性集成算法[J];计算机仿真;2009年10期
4 赵强利;蒋艳凰;徐明;;选择性集成算法分类与比较[J];计算机工程与科学;2012年02期
5 叶云龙;杨明;;一种基于优化的随机子空间分类集成算法[J];微电子学与计算机;2009年10期
6 王羡慧;覃征;张选平;高洪江;;采用仿射传播的聚类集成算法[J];西安交通大学学报;2011年08期
7 马超;陈西宏;徐宇亮;王光明;;广义邻域粗集下的集成特征选择及其选择性集成算法[J];西安交通大学学报;2011年06期
8 关菁华;刘大有;;一种挖掘概念漂移数据流的选择性集成算法[J];计算机科学;2010年01期
9 赵强利;蒋艳凰;徐明;;基于FP-Tree的快速选择性集成算法[J];软件学报;2011年04期
10 张文静;;基于Mapreduce的权重集成算法在煤炭行业数据处理中的应用[J];煤炭技术;2013年09期
中国博士学位论文全文数据库 前1条
1 董晓健;基因表达式编程集成算法研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前4条
1 孟晓龙;基于时机的模糊谱图划分聚类集成算法的研究[D];西南交通大学;2015年
2 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年
3 姚沛津;基于朴素贝叶斯的集成算法研究[D];华南理工大学;2013年
4 陈卓;基于DHGF综合集成算法的企业并购风险评估[D];中央财经大学;2013年
,本文编号:684332
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/684332.html