一种优化初始聚类中心的k-means算法
本文关键词:一种优化初始聚类中心的k-means算法,由笔耕文化传播整理发布。
【摘要】:随机选择初始聚类中心的k-means算法易使聚类陷入局部最优解、聚类结果不稳定且受孤立点影响大等问题.针对这些问题,提出了一种优化初始聚类中心的方法及孤立点排除法.该算法首先选择距离最远的两点加入初始化中心,再根据这两点将原始簇分成两个聚簇,在这两个簇中挑选方差较大的簇按照一定的规则进行分裂直至找到k个中心,初始中心的选择过程中用到孤立点排除法.在UCI数据集及人造含一定比例的噪音数据集下,通过实验比较了改进算法与其他算法的优劣.实验表明,改进后的算法不仅受孤立点的影响小、稳定性好而且准确度也高.
【作者单位】: 上海师范大学信息与机电工程学院;
【关键词】: 初始聚类中心 k-means算法 孤立点排除法 聚簇 UCI数据集
【分类号】:TP311.13
【正文快照】: 0引言聚类分析是数据挖掘研究的一项重要技术,它的诞生为从大量的数据中获取有价值的知识提供了一种有效的方法.它广泛地应用于文本搜索、模式识别人工智能、图像分析等领域[1].常用的聚类分析方法包括基于划分、基于层次、基于密度、基于网格和基于模型等算法[2].k-means是划
【相似文献】
中国期刊全文数据库 前10条
1 李玮;薛惠锋;詹海亮;;基于划分采样的初始聚类中心算法[J];太原理工大学学报;2011年04期
2 孟子健;马江洪;;一种可选初始聚类中心的改进k均值算法[J];统计与决策;2014年12期
3 顾洪博;张继怀;;聚类算法初始聚类中心的优化[J];西安工程大学学报;2010年02期
4 沈国珍;;依赖数据密度的K均值初始化调优[J];计算机工程与应用;2014年11期
5 王汉芝;刘振全;;一种新的确定K-均值算法初始聚类中心的方法[J];天津科技大学学报;2005年04期
6 刘峰,孙超,李斌;一种改进的C均值法初始类划分方法[J];计算机工程与设计;2005年02期
7 谢娟英;郭文娟;谢维信;高新波;;基于样本空间分布密度的初始聚类中心优化K-均值算法[J];计算机应用研究;2012年03期
8 苏锦旗;薛惠锋;詹海亮;;基于划分的K-均值初始聚类中心优化算法[J];微电子学与计算机;2009年01期
9 王赛芳;戴芳;王万斌;张晓宇;;基于初始聚类中心优化的K-均值算法[J];计算机工程与科学;2010年10期
10 韩凌波;王强;蒋正锋;郝志强;;一种改进的k-means初始聚类中心选取算法[J];计算机工程与应用;2010年17期
中国硕士学位论文全文数据库 前1条
1 张永晶;初始聚类中心优化的K-means改进算法[D];东北师范大学;2013年
本文关键词:一种优化初始聚类中心的k-means算法,,由笔耕文化传播整理发布。
本文编号:458780
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/458780.html