基于k近邻的密度聚类算法研究
发布时间:2021-06-09 02:59
近年来,数据量日益增多,数据分布呈现多样化、复杂化。在众多应用领域中,包含任意形状、任意密度以及任意大小的簇的数据集广泛出现。传统的聚类算法无法有效地识别出分布复杂的数据点中的簇结构。同时,很多新的聚类算法在各种数据集中检测任意簇时,通常会遇到精确性不高或者执行效率较低等问题。因此,在分布复杂的数据集中,精确地检测出任意形状、任意密度以及任意大小的簇,是当前亟待解决的重点问题之一,也是聚类的研究热点。k近邻是一种分类算法,综合考虑了数据点所具有的特性和所处的空间位置。在基于密度的方法中,密度可以通过数据分布的紧密程度来决定,并且基于密度的聚类方法也适合检测数据集中任意形状的簇结构。本文在深入研究k近邻与基于密度的聚类算法的基础上,提出了两个有效检测任意簇的基于k近邻的密度聚类算法CUDG和CLDB。(1)CUDG算法通过把每个数据点看作为自然界中的质点,定义了数据点间密度引力的概念。首先根据每个数据点的周围邻居分布密集程度获得其局部密度,然后迭代地将每个数据点分配给密度比它大且距其最近的互近邻点形成初始簇,最后将具有共同数据点的初始簇进行合并得到最终簇。本文实验将CUDG分别与六个对比...
【文章来源】:兰州交通大学甘肃省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
密度引力聚类思想
【参考文献】:
博士论文
[1]面向复杂数据的聚类算法研究[D]. 陈梅.兰州大学 2016
本文编号:3219775
【文章来源】:兰州交通大学甘肃省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
密度引力聚类思想
【参考文献】:
博士论文
[1]面向复杂数据的聚类算法研究[D]. 陈梅.兰州大学 2016
本文编号:3219775
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3219775.html