当前位置:主页 > 科技论文 > 软件论文 >

面向高维数据的自适应半监督聚类集成方法的研究

发布时间:2021-08-10 08:22
  随着互联网的飞速发展,数据的维度和数量呈爆炸式增长,高维数据的聚类分析问题显得愈发重要。传统的聚类分析方法不能有效地对高维数据聚类,因此研究者提出半监督聚类集成的方法来解决此类问题。半监督聚类集成将半监督学习和集成学习应用在聚类分析任务中,能够显著地提升高维数据聚类结果的准确性、稳定性和鲁棒性。然而,当前的半监督聚类集成方法存在一些缺点,例如:1)没有专门设计有效的方法处理高维数据问题;2)不能充分地利用先验知识,尤其是成对约束信息;3)在聚类集成生成过程中,随机性太强,没有采用自适应的方法来优化生成过程;4)在聚类集成一致性函数过程中,考虑了所有的聚类成员的结果,即使有些聚类成员的结果质量很差。为解决这些缺点,本文提出了一种双重自适应的半监督聚类集成方法(DASSCE)。DASSCE主要贡献有:1)提出了一种基于bagging约束的子空间生成方法,该方法使用bagging约束产生一组约束子集,并使用不同的约束子集指导子空间生成。2)设计了一种自适应的约束聚类集成选择方法,该方法能够有效地移除聚类结果中的冗余和噪音划分结果。3)采取自适应的子空间集合优化方法,从而获得了更好的聚类效果。... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:78 页

【学位级别】:硕士

【部分图文】:

面向高维数据的自适应半监督聚类集成方法的研究


维度灾难

集成学习,无监督,森林,聚类集


华南理工大学硕士学位论文监督的集成学习的集成学习即是原始数据集带有样例标记,典型的代表tion ensemble)方法。目前工业界最常用的几种树集成模型:rest)、梯度提升决策树[41](gradient boosting decisiontree,GBDT)radient boosting)都属于有监督的集成学习。这些树模型具有泛化数据、运行速度快等优点,所以一直以来都是工业界的宠儿。以单介绍一种分类集成模型。如图 2-1 所示:随机森林包含两个部和投票决策过程。首先,随机森林通过对原始数据集使用 boots数据子集;然后用每组数据子集训练一棵决策树,因为有多个数随机生成了多棵决策树,这也是随机森林的名字由来。最后,对机森林采用投票的方式获得最终的分类结果。

参考图,一致性函数


下四类:第一类被称为成对相似性方法,也被称为协相关矩阵的方法。在这类方法中,研究者充分利用数据点两两之间的共现关系来结合多个聚类划分结果(可以参考图2-3 (c)),相关文献包括[57-60]。在文献[57]中,Yang 等人认为每一个聚类划分的性能有好有坏,所以他们使用了聚类有效性指标来评估每一个划分结果,划分结果越好的给予越高的权重,以此来区别对待每个划分结果。最后,他们通过构建一个加权的协相关矩阵作为一致性函数。在文献[58]中,Fred 和 Jain 提出了一种基于证据积累(evidenceaccumulation)

【参考文献】:
期刊论文
[1]高分辨率遥感影像的随机森林变化检测方法[J]. 冯文卿,眭海刚,涂继辉,孙开敏,黄伟明.  测绘学报. 2017(11)
[2]基于选择性聚类集成的图像目标分类方法[J]. 储岳中,刘恒,张学锋,潘祥.  微电子学与计算机. 2017(11)
[3]基于半监督聚类集成的未知网络协议识别方法[J]. 林荣强,李鸥,李青,刘琰.  小型微型计算机系统. 2016(06)
[4]基于聚类集成的用户负荷模式识别[J]. 黄剑文,严宇平.  计算机应用与软件. 2014(12)
[5]基于半监督聚类的免疫入侵检测算法研究[J]. 王小伟,王素芳.  计算机应用与软件. 2013(02)
[6]基于谱聚类的聚类集成算法[J]. 周林,平西建,徐森,张涛.  自动化学报. 2012(08)
[7]一种基于聚类集成技术的混合型数据聚类算法[J]. 罗会兰,危辉.  计算机科学. 2010(11)
[8]使用谱聚类算法解决文本聚类集成问题[J]. 徐森,卢志茂,顾国昌.  通信学报. 2010(06)

博士论文
[1]半监督低秩矩阵学习及其应用[D]. 贺杨成.上海交通大学 2015

硕士论文
[1]基于约束的半监督聚类的图像分割算法研究[D]. 李巧兰.西安电子科技大学 2014
[2]基于半监督集成的遥感图像的分割和分类[D]. 王婷.西安电子科技大学 2009



本文编号:3333829

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3333829.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户daede***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com