基于平均差异度优选初始聚类中心的改进K-均值聚类算法
发布时间:2019-08-10 06:57
【摘要】:针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.
[Abstract]:In order to solve the problem that K-means clustering algorithm depends on initial clustering center, an improved algorithm for selecting initial clustering center based on data spatial distribution is proposed. The algorithm first defines the sample distance, the average difference degree of the sample set and the overall average difference degree of the sample set, and then sorts each sample according to the average difference degree, and selects the sample whose average difference degree is large and the difference degree between the selected clustering center and the selected clustering center is larger than the total average difference degree of the sample set as the initial clustering center. The experimental results show that the improved algorithm not only improves the stability and accuracy of clustering results, but also reduces the number of iterations and converges quickly.
【作者单位】: 湖南理工学院信息与通信工程学院;
【基金】:国家自然科学基金项目(61473118) 湖南省自然科学基金项目(2015JJ2074) 湖南省高校创新平台开放基金项目(13K102) 湖南省科技计划项目(2016TP1021)
【分类号】:TP311.13
本文编号:2525043
[Abstract]:In order to solve the problem that K-means clustering algorithm depends on initial clustering center, an improved algorithm for selecting initial clustering center based on data spatial distribution is proposed. The algorithm first defines the sample distance, the average difference degree of the sample set and the overall average difference degree of the sample set, and then sorts each sample according to the average difference degree, and selects the sample whose average difference degree is large and the difference degree between the selected clustering center and the selected clustering center is larger than the total average difference degree of the sample set as the initial clustering center. The experimental results show that the improved algorithm not only improves the stability and accuracy of clustering results, but also reduces the number of iterations and converges quickly.
【作者单位】: 湖南理工学院信息与通信工程学院;
【基金】:国家自然科学基金项目(61473118) 湖南省自然科学基金项目(2015JJ2074) 湖南省高校创新平台开放基金项目(13K102) 湖南省科技计划项目(2016TP1021)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 李玮;薛惠锋;詹海亮;;基于划分采样的初始聚类中心算法[J];太原理工大学学报;2011年04期
2 孟子健;马江洪;;一种可选初始聚类中心的改进k均值算法[J];统计与决策;2014年12期
3 顾洪博;张继怀;;聚类算法初始聚类中心的优化[J];西安工程大学学报;2010年02期
4 沈国珍;;依赖数据密度的K均值初始化调优[J];计算机工程与应用;2014年11期
5 王汉芝;刘振全;;一种新的确定K-均值算法初始聚类中心的方法[J];天津科技大学学报;2005年04期
6 刘峰,孙超,李斌;一种改进的C均值法初始类划分方法[J];计算机工程与设计;2005年02期
7 谢娟英;郭文娟;谢维信;高新波;;基于样本空间分布密度的初始聚类中心优化K-均值算法[J];计算机应用研究;2012年03期
8 苏锦旗;薛惠锋;詹海亮;;基于划分的K-均值初始聚类中心优化算法[J];微电子学与计算机;2009年01期
9 张文君;顾行发;陈良富;余涛;许华;;基于均值-标准差的K均值初始聚类中心选取算法[J];遥感学报;2006年05期
10 王赛芳;戴芳;王万斌;张晓宇;;基于初始聚类中心优化的K-均值算法[J];计算机工程与科学;2010年10期
相关硕士学位论文 前1条
1 张永晶;初始聚类中心优化的K-means改进算法[D];东北师范大学;2013年
,本文编号:2525043
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2525043.html