基于耦合度量的多尺度聚类挖掘方法
发布时间:2024-02-26 06:06
为了能够更好地对非独立同分布的多尺度分类型数据集进行研究,基于无监督耦合度量相似性方法,提出针对非独立同分布的分类属性型数据集的多尺度聚类挖掘算法。首先,对基准尺度数据集进行基于耦合度量的基准尺度聚类;其次,提出基于单链的尺度上推和基于Lanczos核的尺度下推尺度转换算法;最后,利用公用数据集以及H省真实数据集进行实验验证。将耦合度量相似性(Couple metric similarity,CMS)、逆发生频率(Inverse occurrence frequency,IOF)、汉明距离(Hamming distance,HM)等方法与谱聚类结合作为对比算法,结果表明,尺度上推算法与对比算法相比,NMI值平均提高13.1%,MSE值平均减小0.827,F-score值平均提高12.8%;尺度下推算法NMI值平均提高19.2%,MSE值平均减小0.028,F-score值平均提高15.5%。实验结果表明,所提出的算法具有有效性和可行性。
【文章页数】:14 页
【部分图文】:
本文编号:3911445
【文章页数】:14 页
【部分图文】:
图1尺度上推思想
尺度下推是尺度转换的另一种表现形式。本文借助Lanczos插值和分裂层次聚类的思想提出了多尺度聚类尺度下推算法(DownscalingbasedonLanczos,DSAL)。该算法的思想是:首先得到基准尺度聚类结果,其次将基准尺度聚类结果作为已知样本,利用Lanczos核....
图2尺度下推思想
图1尺度上推思想算法3多尺度聚类尺度下推算法DSAL
图3.1耦合度量相假设数据集DB由多个数据对象U组成,
27CMS相似性度量方法主要包含三部分:属性内相似性、属性间相似性以及耦合度量相似性。通过属性内和属性间的相似性以及耦合度量相似性捕获对象间相似性。本节将对这三部分分别进行介绍,主要包括定义和主要思想,图3.1展示了它的学习框架、工作机制和关键组成。CMS首先根据属性内相似性捕获....
本文编号:3911445
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3911445.html
最近更新
教材专著