基于多代表点的大规模数据模糊聚类算法
本文关键词:基于多代表点的大规模数据模糊聚类算法 出处:《控制与决策》2016年12期 论文类型:期刊论文
【摘要】:针对传统模糊聚类在大规模数据场景下,由于内存的限制不能一次装载所有数据,以及在通过聚类捕捉数据的潜在结构和描述各个类时仅使用单个代表点存在信息量不足的问题,提出一种基于多代表点的大规模数据模糊聚类算法.该算法通过对大规模数据进行分块,在对每个数据块进行聚类时使用多个代表点描述捕捉到的数据的潜在结构和各个类信息,并通过考虑代表点与代表点之间在聚类过程中的约束关系,提高最后聚类结果的精度.在模拟数据集和真实数据集上的3组实验验证了所提出算法的有效性.
[Abstract]:A large - scale data fuzzy clustering algorithm based on multi - representation points is proposed for the traditional fuzzy clustering under the large - scale data scene , and a large - scale data fuzzy clustering algorithm based on a plurality of representative points is proposed because of the insufficient information amount of the potential structure of the cluster - capturing data and the description of each class , and the accuracy of the final clustering result is improved by taking into account the constraint relation between the representative point and the representative point in clustering .
【作者单位】: 江南大学数字媒体学院;
【基金】:国家自然科学基金项目(61272210) 江苏省杰出青年基金项目(BK20140001) 江苏省自然科学基金项目(BK20130155)
【分类号】:TP311.13
【正文快照】: 0引言随着计算机网络技术的快速发展,各种信息正以前所未有的速度高速增长,如何从大量的数据中提取有效信息是当前大规模数据应用的关键点,也是难点[1-3].聚类是一种行之有效的数据分析工具,能够从纷繁复杂的数据中发现隐藏在其内部的潜在结构,在无监督的情况下将数据按照其性
【相似文献】
相关期刊论文 前10条
1 姜英姿;;大规模数据的计算机处理技术[J];徐州工程学院学报;2005年05期
2 刘忠宝;赵文娟;;面向大规模数据的模糊支持向量数据描述[J];广西大学学报(自然科学版);2012年06期
3 牛新征;佘X;;面向大规模数据的快速并行聚类划分算法研究[J];计算机科学;2012年01期
4 谌超;强保华;石龙;;基于Hadoop MapReduce的大规模数据索引构建与集群性能分析[J];桂林电子科技大学学报;2012年04期
5 刘春艳;;基于云的招生系统研究与设计[J];电子技术与软件工程;2013年13期
6 代红兵;;适合于大规模数据快速存取的文件系统设计[J];中国科学院大学学报;1993年04期
7 游进国;杨卓荦;胡建华;奚建清;;一种支持大规模数据的多维可视化分析框架[J];计算机工程;2011年19期
8 亓开元;赵卓峰;房俊;马强;;针对高速数据流的大规模数据实时处理方法[J];计算机学报;2012年03期
9 陈胜利;李俊奎;刘小东;;Mintegration:一种针对大规模数据的并发数据集成方案[J];山东大学学报(工学版);2010年04期
10 应俊;杨茂斌;;一种基于多重索引的大规模数据快速查找算法[J];计算机科学;2009年03期
相关会议论文 前1条
1 徐健;陈光喜;;一种基于优化处理较大规模数据的支持向量分类机[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年
相关重要报纸文章 前1条
1 ;戴尔务实推动云计算发展[N];网络世界;2010年
相关博士学位论文 前1条
1 金冉;面向大规模数据的聚类算法研究及应用[D];东华大学;2015年
相关硕士学位论文 前5条
1 田大鑫;基于GIS的大规模数据下K优路径规划算法的研究与实现[D];北京理工大学;2016年
2 刘伟;面向大规模数据的高效LTR调研系统设计与实现[D];南京大学;2015年
3 钱彦江;大规模数据聚类技术研究与实现[D];电子科技大学;2009年
4 张新铭;金融应用中大规模数据处理的性能优化[D];浙江大学;2007年
5 马翠云;基于HBase的大规模数据存储解决方案的设计和实现[D];山东大学;2015年
,本文编号:1366310
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1366310.html