基于密度聚类算法的若干改进及应用研究
发布时间:2024-05-07 22:58
随着大数据时代的到来和人工智能的逐渐成熟,寻求分析和利用大规模原始数据并从中发掘价值信息的方式是学术界的研究重点。聚类技术在数据挖掘中占据重要地位,由海量数据中获取数据潜在内部结构是当下人工智能领域的重点研究任务。截至目前,无监督学习领域主要包括两类最具竞争力聚类技术,一是密度峰值聚类(Clustering by Fast Search and Find of Density Peaks,DPC)算法,二是基于密度带有噪声的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法。但上述算法依然有一定不足:(1)采取密度峰值聚类算法时必须通过手动设置截断距离参数;(2)密度峰值聚类算法需手动圈出聚类中心点;(3)基于密度带有噪声的空间聚类算法存在全局参数聚类半径Eps需人工设定的问题。结合以上问题,对其提出针对性整改意见:(1)采取基于密度带有噪声的空间聚类算法时,必须通过人工设定获取全局参数聚类半径Eps,对于该问题提出一种改进的基于密度带有噪声空间聚类(Improved Density-Ba...
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
本文编号:3967116
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2.2决策图中聚类中心数难以确定的例子在ρ、δ中挑选样本较大者作为聚类中心,并聚类余下样本,即将其列入密
2.2决策图中聚类中心数难以确定样本较大者作为聚类中心,并聚类近距离更近的样本所在的类中,直取一步分配策略后,效率得到显图,该算法达到了通过二维平面呈
图2.3γ数值变化情况
图2.3γ数值变化情况代表指标集,纵轴代表γ数值:γ数值由非聚类中心转至聚类中心时出现跳
图3.1spiral数据集k-dist图
图3.1spiral数据集k-dist图DBSCAN算法能够运用绘制降序k-dist图的可视想”值无限接近;不过仍会因为细小差距,导致ts以后,通过以下方式对DBSCAN算法在输入参
图3.2聚类结果对比
(c)aggregation数据集聚类结果(d)flame数据集聚类结果图3.2聚类结果对比通过对UCI数据集聚类,从上述四组聚类结果可以清晰看出,DBSCAN算法和DPC算法对一些数据集无法得到合理的结果,而CS-DBSCAN算法在测试的数据集上得到的聚类结果,基本反映数据的....
本文编号:3967116
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3967116.html