当前位置:主页 > 科技论文 > 软件论文 >

基于空间变换的聚类算法研究

发布时间:2021-06-09 22:52
  基于空间变换的聚类(CST:Clustering based on Space Transformation)是本文提出的一个新的聚类算法统一框架,其旨在提高单个聚类算法的有效性和普适性,并缓解用户对选择合适聚类算法的困难和选择合适参数的困难。空间变换是将原始的欧氏距离空间通过非线性的映射,建立到一个新的相似度空间。不同于深度学习的特征空间提取,这里的空间变换的映射是显式的,具有可解释性的,更适用于聚类算法研究。在这个新的相似度空间中,聚类的结构信息更加凸显。对于聚类的有用信息来说,在不减少正面信息的情况下,大大减少负面信息,使其最终所保留的信息更易于被传统的聚类算法所处理,并保持对数据中的离群点和异常点有一定的鲁棒性。本文以谱聚类的使用为例,通过对其输入矩阵的空间变换,来观察聚类的最终效果。本文研究了两类空间变换的范式的有效性和普适性,并试图讨论空间变换对聚类结果的影响因素。为了自动选择合适的空间变换的聚类结果,本文提出使用聚类内部指标。空间变换的关键问题是聚类内部指标的设计,本文首次将聚类的机制问题纳入聚类内部指标的设计,并使这个新的聚类内部指标总体上明显优于现存的聚类内部指标,并... 

【文章来源】:宁波大学浙江省

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
引言
1 绪论
    1.1 研究背景
    1.2 相关研究
        1.2.1 多目标优化的研究
        1.2.2 聚类集成的研究
        1.2.3 聚类算法推荐的研究
    1.3 文章的组织结构
2 聚类相似性的空间变换
    2.1 空间变换的初始化
    2.2 聚类的外部指标
    2.3 相似度矩阵的可视化
    2.4 关联矩阵的负证据抹除
    2.5 欧式距离矩阵的类高斯过滤
    2.6 实验结果
        2.6.1 所使用的数据集
        2.6.2 有效性之关联矩阵的负证据抹除
        2.6.3 有效性之欧式距离矩阵的类高斯过滤
        2.6.4 两种空间变换的比较
    2.7 本章小结
3 融合密度信息的聚类内部指标
    3.1 内部指标在聚类分析中的重要性
    3.2 相关工作
        3.2.1 内部有效性指标的构成元素
        3.2.2 目前内部有效性指标的局限性
    3.3 一个新的密度融合距离
        3.3.1 使用密度估计处理离群点
        3.3.2 使用互密度处理密度敏感聚类
        3.3.3 融合离群点因素与互密度因素
    3.4 CVDD:一个新的聚类有效性指标
    3.5 实验结果
        3.5.1 比较最佳划分的质量
        3.5.2 预测最佳的聚类个数
        3.5.3 讨论密度估计中参数的影响
    3.6 本章小节
4 总结与展望
参考文献
在学研究成果
致谢
Abstract of Thesis
论文摘要



本文编号:3221478

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3221478.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户efb43***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com