高维数据子空间聚类融合算法研究
发布时间:2021-01-08 15:20
聚类分析是模式识别、机器学习等研究领域中的一个备受关注的课题,在许多领域发挥着至关重要的作用,如信息检索与分类、市场营销以及互联网等。在面临高维空间和大数据量时,由于距离度量方法的限制,传统的聚类分析方法在超高维数据上往往不能得到很好的效果。近几年,聚类融合方法开始获得越来越多的关注,它的主要思想是将不同角度的聚类分析结果整合成一个统一的类别结构,以得到一个更鲁棒、更稳定、更准确的最终分类结果。本文对高维数据的聚类融合方法进行深度探讨和研究,从融合算法和高维数据子空间划分方法两个方面开展工作。主要工作如下:1.现有的大部分融合算法没有考虑基聚类结果的有效性,将他们平等对待,其精度易受低质量基聚类结果的影响。部分聚类融合算法虽然考虑加权策略,但仍然忽略了性能糟糕的基聚类结果对最终结果的负面影响。针对这个问题,本文提出了一种基于新的加权策略的聚类融合算法。其中,我们提出了一种新的基聚类结果有效性的评价方法。该方法基于每一个基聚类结果与整体结果的最优匹配得分来衡量其有效性,并根据其有效性赋予相应的权重。最优匹配得分的设计充分考虑基聚类结果中的集群信息,不仅包含了该基聚类结果中与整体划分在同一...
【文章来源】: 孙瑶 深圳大学
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
聚类融合过程示意图
聚类融合方法分类融合成员的产生阶段主要是得到多个聚类结果的类别标签(labelsofmultiple
一致函数的设计流程图
【参考文献】:
期刊论文
[1]大数据的一个重要方面:数据可用性[J]. 李建中,刘显敏. 计算机研究与发展. 2013(06)
[2]基于隐含变量的聚类集成模型[J]. 王红军,李志蜀,成飏,周鹏,周维. 软件学报. 2009(04)
[3]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇. 软件学报. 2008(01)
[4]基于投票机制的融合聚类算法[J]. 蒋盛益. 小型微型计算机系统. 2007(02)
硕士论文
[1]聚类融合算法研究及其应用[D]. 翁芳菲.厦门大学 2008
本文编号:2964829
【文章来源】: 孙瑶 深圳大学
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
聚类融合过程示意图
聚类融合方法分类融合成员的产生阶段主要是得到多个聚类结果的类别标签(labelsofmultiple
一致函数的设计流程图
【参考文献】:
期刊论文
[1]大数据的一个重要方面:数据可用性[J]. 李建中,刘显敏. 计算机研究与发展. 2013(06)
[2]基于隐含变量的聚类集成模型[J]. 王红军,李志蜀,成飏,周鹏,周维. 软件学报. 2009(04)
[3]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇. 软件学报. 2008(01)
[4]基于投票机制的融合聚类算法[J]. 蒋盛益. 小型微型计算机系统. 2007(02)
硕士论文
[1]聚类融合算法研究及其应用[D]. 翁芳菲.厦门大学 2008
本文编号:2964829
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2964829.html