当前位置:主页 > 科技论文 > 软件论文 >

引入信息熵的CURE聚类算法

发布时间:2018-02-22 23:22

  本文关键词: 层次聚类 CURE算法 信息熵 代表点选取 出处:《计算机应用研究》2017年08期  论文类型:期刊论文


【摘要】:为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。
[Abstract]:In order to improve the quality of traditional CURE(clustering using representatives-based clustering algorithm, information entropy is introduced to improve it. The information provided by the elements in the cluster is used to measure the relationship between different clusters and to describe the distribution of data. The experimental results on UCI and artificial datasets show that the proposed algorithm improves the clustering accuracy to some extent and has a higher clustering efficiency than the traditional CURE algorithm in large datasets.
【作者单位】: 武汉科技大学计算机科学与技术学院;武汉科技大学智能信息处理与实时工业系统湖北省重点实验室;
【基金】:国家自然科学基金资助项目(41571396)
【分类号】:TP311.13

【相似文献】

相关期刊论文 前2条

1 刘明辉;周磊;谢婷婷;霍烁烁;;基于CURE算法的电子装备时变误差分析[J];无线电工程;2012年07期

2 ;[J];;年期

相关重要报纸文章 前1条

1 ;CURE研究中氯吡格雷的成本-效果分析[N];医药经济报;2003年



本文编号:1525563

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1525563.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf045***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com