基于传递距离的密度峰值聚类算法研究
发布时间:2021-06-15 22:16
聚类是一个无监督分类技术,根据数据元素间的相似关系,将数据划分到不同的团簇中。通过分析聚类结果,观察不同团簇的分布规律,能够发现数据背后隐藏的规律。随着社会信息化的发展,聚类分析在社会生活中发挥着越来越重要的作用,已广泛应用于社会多个领域。数据规模的快速增长和多样化,提出适应能力更强的聚类算法成为当前急需解决的问题。基于密度的聚类算法能适用于任意形状数据的聚类,具有较强抗噪声能力,成为近年来聚类算法研究的方向。密度峰值聚类算法(Clustering by fast search and find of density peak,CFSFDP)是Alex Rodriguez提出的基于密度的聚类算法。该算法思想简单、聚类效果好、时间效率高,在一些数据集上获得了不错的聚类效果,但该算法依然存在一些不足:(1)CFSFDP算法基于假设:中心结点被密度比它小的结点包围,中心结点到比它密度大的结点距离较远。该假设认为同一团簇中只有一个密度峰值,当团簇中有多个密度峰值时,该算法容易将一个团簇错误划分为多个团簇,不适用于团簇中有多个密度峰值的数据集。(2)截断距离是CFSFDP算法中的唯一参数,截断距...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
传递距离示意图
gauss数据集PBDBI和DBI指标值变化情况
cyclic数据集PBDBI和DBI指标值变化情况
【参考文献】:
期刊论文
[1]基于划分的聚类算法研究综述[J]. 贾瑷玮. 电子设计工程. 2014(23)
[2]聚类有效性评价综述[J]. 杨燕,靳蕃,KAMEL Mohamed. 计算机应用研究. 2008(06)
硕士论文
[1]基于密度峰值聚类的两种改进算法的研究[D]. 晏焕钱.兰州大学 2018
[2]基于传递距离的度量学习和聚类算法研究[D]. 戴天辰.扬州大学 2018
[3]一类基于密度的聚类算法研究[D]. 逄琳.山东师范大学 2017
本文编号:3231862
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
传递距离示意图
gauss数据集PBDBI和DBI指标值变化情况
cyclic数据集PBDBI和DBI指标值变化情况
【参考文献】:
期刊论文
[1]基于划分的聚类算法研究综述[J]. 贾瑷玮. 电子设计工程. 2014(23)
[2]聚类有效性评价综述[J]. 杨燕,靳蕃,KAMEL Mohamed. 计算机应用研究. 2008(06)
硕士论文
[1]基于密度峰值聚类的两种改进算法的研究[D]. 晏焕钱.兰州大学 2018
[2]基于传递距离的度量学习和聚类算法研究[D]. 戴天辰.扬州大学 2018
[3]一类基于密度的聚类算法研究[D]. 逄琳.山东师范大学 2017
本文编号:3231862
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3231862.html