当前位置:主页 > 科技论文 > 软件论文 >

快速搜索与发现密度峰值聚类算法的优化研究

发布时间:2017-09-28 05:38

  本文关键词:快速搜索与发现密度峰值聚类算法的优化研究


  更多相关文章: 聚类 密度峰值 近邻距离曲线 类合并


【摘要】:CFSFDP是基于密度的新聚类算法,可聚类非球形数据集,具有聚类速度快、实现简单等优点。CFSFDP需人工尝试确定密度阈值dc,且对一个类中存在多密度峰值的数据无法进行准确聚类。为解决该缺点,提出基于近邻距离曲线和类合并优化CFSFDP(简称NM-CFSFDP)的聚类算法。算法用近邻距离曲线变化情况自动确定密度阈值dc,采用确定dc的CFSFDP对数据聚类,并利用计算dc值的方法指导类的合并,引入内聚程度衡量参数解决了类合并后不能撤销的难题,从而实现对多密度峰值数据的正确聚类。通过实验对比,NM-CFSFDP算法确实比CFSFDP算法具有更加精确的聚类效果。
【作者单位】: 中国矿业大学计算机科学与技术学院;常熟理工学院计算机科学与工程学院;重庆大学计算机科学与技术学院;
【关键词】聚类 密度峰值 近邻距离曲线 类合并
【基金】:国家自然科学基金资助项目(61173130)
【分类号】:TP311.13
【正文快照】: 0引言聚类分析(cluster analysis)简称聚类(clustering),是一个将数据对象(或观测)划分成子集的过程,也称做无监督分类。聚类分析已经广泛用于许多领域[1],许多不同的聚类策略被提出,但都具有非一致性的缺点。K-means和K-中心点算法,数据点通常分配到最近距离中心点,该类方法

【相似文献】

中国期刊全文数据库 前1条

1 阴晋岭;;解决词义分类合并问题的一种方法[J];中国科教创新导刊;2009年02期



本文编号:934098

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/934098.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d8815***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com