一种面向大数据的快速自动聚类算法
发布时间:2018-08-26 08:08
【摘要】:针对大数据环境下高维数据聚类速度慢、准确率低的问题,提出了一种面向大数据的快速自动聚类算法(FACABD)。FACABD聚类算法利用谱聚类算法对大数据集进行归一化和列降维,提出了一种新的快速区域进化的粒子群算法(FRE-PSO),并利用该算法进行行降维;然后在行列降维的基础上,引入聚类模糊隶属度基数,自动发现簇的数目,根据类簇数目,采用FRE-PSO算法结合模糊聚类算法,实现了快速自动聚类。在多个不同数据集上的实验结果表明,该算法能够在数据驱动下快速自动聚类,与其他聚类算法相比,有效地提高了运行速度和精度。
[Abstract]:Aiming at the problem of low accuracy and low speed of high-dimensional data clustering under big data environment, a fast automatic clustering algorithm (FACABD) .FACABD for big data is proposed. In this paper, a new fast region evolution particle swarm optimization algorithm (FRE-PSO) is proposed, and the row dimension is reduced by using this algorithm, and then, based on the reduction of column and column dimension, the fuzzy membership degree is introduced to automatically find the number of clusters, and according to the number of clusters, the number of clusters is automatically discovered. FRE-PSO algorithm combined with fuzzy clustering algorithm is used to realize fast automatic clustering. The experimental results on several different data sets show that the proposed algorithm can quickly and automatically cluster under the driving of data. Compared with other clustering algorithms, the algorithm can effectively improve the running speed and precision.
【作者单位】: 南阳理工学院计算机与信息工程学院;济源职业技术学院;南通大学计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(61402244)
【分类号】:TP18;TP311.13
本文编号:2204253
[Abstract]:Aiming at the problem of low accuracy and low speed of high-dimensional data clustering under big data environment, a fast automatic clustering algorithm (FACABD) .FACABD for big data is proposed. In this paper, a new fast region evolution particle swarm optimization algorithm (FRE-PSO) is proposed, and the row dimension is reduced by using this algorithm, and then, based on the reduction of column and column dimension, the fuzzy membership degree is introduced to automatically find the number of clusters, and according to the number of clusters, the number of clusters is automatically discovered. FRE-PSO algorithm combined with fuzzy clustering algorithm is used to realize fast automatic clustering. The experimental results on several different data sets show that the proposed algorithm can quickly and automatically cluster under the driving of data. Compared with other clustering algorithms, the algorithm can effectively improve the running speed and precision.
【作者单位】: 南阳理工学院计算机与信息工程学院;济源职业技术学院;南通大学计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(61402244)
【分类号】:TP18;TP311.13
【相似文献】
相关期刊论文 前8条
1 陈瑜;唐常杰;叶尚玉;李川;姜钥;刘齐宏;;基于基因表达式编程的自动聚类方法[J];四川大学学报(工程科学版);2007年06期
2 周勇;;基于不可分辨关系的文本自动聚类[J];计算机系统应用;2012年12期
3 王舵;郄君;张娟;李文斌;;一种快速词自动聚类算法[J];计算机应用与软件;2010年08期
4 孙静,朱杰,徐向华;一种新的中文词自动聚类算法[J];上海交通大学学报;2003年S2期
5 崔尚卿;马秀莉;唐世渭;王文清;;基于不均匀密度的自动聚类算法[J];计算机工程;2008年23期
6 王冲鑏;赵旭;邹毅;刘允才;;基于轨迹片段自动聚类的密集场景运动模式分析(英文)[J];中国通信;2013年04期
7 常娥;;基于LSI理论的文本自动聚类研究[J];图书情报工作;2012年11期
8 邓健爽;郑启伦;彭宏;邓维维;;基于搜索引擎的关键词自动聚类法[J];计算机科学;2007年03期
相关硕士学位论文 前3条
1 张彦儒;基于量子粒子群优化的自动聚类算法研究[D];西安电子科技大学;2013年
2 马亚娟;基于人工免疫系统的自动聚类算法及其应用[D];西安电子科技大学;2012年
3 刘大刚;基于CUDA和GEP的并行自动聚类算法[D];福建师范大学;2014年
,本文编号:2204253
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2204253.html