一种基于抽样的谱聚类集成算法
本文关键词:一种基于抽样的谱聚类集成算法
更多相关文章: 抽样 谱聚类 聚类集成 相似性矩阵 有效性指标
【摘要】:谱聚类是利用样本数据集的相似性矩阵中特征向量的性质对样本数据集进行聚类.而随着数据规模的增加,谱聚类算法所耗时间会因为大规模的特征分解而明显增大.采用抽样方法可以有效降低算法所耗时间,但是简单随机抽样子集之间关联性太弱,通常无法准确反映数据集的分布特征.基于此,设计了一种新的抽样策略,利用该方法进行多次抽样,生成多个既具有关联性又具有差异性的数据子集.在每个数据子集上分别利用NJW算法(由Ng A Y、Jordom M I和Weiss Y提出)进行谱聚类,并根据最近邻原则将聚类结果映射到全体数据集,生成若干基聚类,最后,将聚类结果集成,得到最终的聚类划分.实验证明,该方法与传统NJW算法以及简单抽样集成算法相比,算法的效率及有效性有了一定的提高.
【作者单位】: 太原师范学院计算机科学与技术系;山西大学计算智能与中文信息处理教育部重点实验室;
【关键词】: 抽样 谱聚类 聚类集成 相似性矩阵 有效性指标
【基金】:国家自然科学基金(61273294) 山西省回国留学人员科研项目(2013-101)
【分类号】:TP311.13
【正文快照】: coexisting relevance and otherness.Then each data subset is spectral clustered by NJW algorithm(the most classicalspectral clustering algorithm,proposed by Ng A Y,Jordom M I and Weiss Y)and every clustering results can bemapped to the whole sample data s
【相似文献】
中国期刊全文数据库 前10条
1 王会青;陈俊杰;;基于图划分的谱聚类方法的研究[J];计算机工程与设计;2011年01期
2 王春腾;符传谊;邢洁清;;基于非负约束的谱聚类方法[J];电脑知识与技术;2011年17期
3 何飞;王晓晨;马粹;梁治国;;生产状态的测地距离谱聚类分析[J];计算机工程与应用;2012年24期
4 薛宁静;;生产状态的熵值评估谱聚类分析[J];计算机工程与应用;2012年19期
5 管涛;王杰;;谱聚类的算子理论研究进展[J];计算机科学;2013年S1期
6 王玲;薄列峰;焦李成;;密度敏感的半监督谱聚类[J];软件学报;2007年10期
7 林立;胡侠;朱俊彦;;基于谱聚类的多文档摘要新方法[J];计算机工程;2010年22期
8 刘馨月;李静伟;于红;尤全增;林鸿飞;;基于共享近邻的自适应谱聚类[J];小型微型计算机系统;2011年09期
9 刘娜;肖智博;鲁明羽;;基于形态学的单词-文档谱聚类方法[J];南京大学学报(自然科学版);2012年02期
10 孟钦学;Paul J.Kennedy;;谱聚类的现状及其在社会网络中的应用(英文)[J];计算机工程与应用;2013年03期
中国博士学位论文全文数据库 前1条
1 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
中国硕士学位论文全文数据库 前10条
1 崔海玉;基于谱聚类的域间社区挖掘算法研究[D];大连海事大学;2016年
2 付刚;基于谱聚类的混合流形学习算法研究[D];安徽理工大学;2016年
3 林珍香;基于谱聚类的个性化推荐系统研究[D];福建农林大学;2016年
4 何心琪;基于谱聚类的水声图像分割技术研究[D];哈尔滨工程大学;2013年
5 赵冬琴;基于谱聚类的MCI影像学分类特征研究与应用[D];太原理工大学;2014年
6 张俊英;基于谱聚类的图书目录重构[D];浙江大学;2010年
7 张天强;基于谱聚类的亲友通话圈挖掘[D];华南理工大学;2013年
8 郑伟;基于核与特征选择的谱聚类社区检测算法[D];西安电子科技大学;2013年
9 由里;基于谱聚类的图像分割方法研究[D];国防科学技术大学;2011年
10 张洪;结合概率潜在语义分析的文本谱聚类研究[D];重庆大学;2012年
,本文编号:1008169
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1008169.html