基于空间变换的聚类算法研究
发布时间:2021-06-09 22:52
基于空间变换的聚类(CST:Clustering based on Space Transformation)是本文提出的一个新的聚类算法统一框架,其旨在提高单个聚类算法的有效性和普适性,并缓解用户对选择合适聚类算法的困难和选择合适参数的困难。空间变换是将原始的欧氏距离空间通过非线性的映射,建立到一个新的相似度空间。不同于深度学习的特征空间提取,这里的空间变换的映射是显式的,具有可解释性的,更适用于聚类算法研究。在这个新的相似度空间中,聚类的结构信息更加凸显。对于聚类的有用信息来说,在不减少正面信息的情况下,大大减少负面信息,使其最终所保留的信息更易于被传统的聚类算法所处理,并保持对数据中的离群点和异常点有一定的鲁棒性。本文以谱聚类的使用为例,通过对其输入矩阵的空间变换,来观察聚类的最终效果。本文研究了两类空间变换的范式的有效性和普适性,并试图讨论空间变换对聚类结果的影响因素。为了自动选择合适的空间变换的聚类结果,本文提出使用聚类内部指标。空间变换的关键问题是聚类内部指标的设计,本文首次将聚类的机制问题纳入聚类内部指标的设计,并使这个新的聚类内部指标总体上明显优于现存的聚类内部指标,并...
【文章来源】:宁波大学浙江省
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
引言
1 绪论
1.1 研究背景
1.2 相关研究
1.2.1 多目标优化的研究
1.2.2 聚类集成的研究
1.2.3 聚类算法推荐的研究
1.3 文章的组织结构
2 聚类相似性的空间变换
2.1 空间变换的初始化
2.2 聚类的外部指标
2.3 相似度矩阵的可视化
2.4 关联矩阵的负证据抹除
2.5 欧式距离矩阵的类高斯过滤
2.6 实验结果
2.6.1 所使用的数据集
2.6.2 有效性之关联矩阵的负证据抹除
2.6.3 有效性之欧式距离矩阵的类高斯过滤
2.6.4 两种空间变换的比较
2.7 本章小结
3 融合密度信息的聚类内部指标
3.1 内部指标在聚类分析中的重要性
3.2 相关工作
3.2.1 内部有效性指标的构成元素
3.2.2 目前内部有效性指标的局限性
3.3 一个新的密度融合距离
3.3.1 使用密度估计处理离群点
3.3.2 使用互密度处理密度敏感聚类
3.3.3 融合离群点因素与互密度因素
3.4 CVDD:一个新的聚类有效性指标
3.5 实验结果
3.5.1 比较最佳划分的质量
3.5.2 预测最佳的聚类个数
3.5.3 讨论密度估计中参数的影响
3.6 本章小节
4 总结与展望
参考文献
在学研究成果
致谢
Abstract of Thesis
论文摘要
本文编号:3221478
【文章来源】:宁波大学浙江省
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
引言
1 绪论
1.1 研究背景
1.2 相关研究
1.2.1 多目标优化的研究
1.2.2 聚类集成的研究
1.2.3 聚类算法推荐的研究
1.3 文章的组织结构
2 聚类相似性的空间变换
2.1 空间变换的初始化
2.2 聚类的外部指标
2.3 相似度矩阵的可视化
2.4 关联矩阵的负证据抹除
2.5 欧式距离矩阵的类高斯过滤
2.6 实验结果
2.6.1 所使用的数据集
2.6.2 有效性之关联矩阵的负证据抹除
2.6.3 有效性之欧式距离矩阵的类高斯过滤
2.6.4 两种空间变换的比较
2.7 本章小结
3 融合密度信息的聚类内部指标
3.1 内部指标在聚类分析中的重要性
3.2 相关工作
3.2.1 内部有效性指标的构成元素
3.2.2 目前内部有效性指标的局限性
3.3 一个新的密度融合距离
3.3.1 使用密度估计处理离群点
3.3.2 使用互密度处理密度敏感聚类
3.3.3 融合离群点因素与互密度因素
3.4 CVDD:一个新的聚类有效性指标
3.5 实验结果
3.5.1 比较最佳划分的质量
3.5.2 预测最佳的聚类个数
3.5.3 讨论密度估计中参数的影响
3.6 本章小节
4 总结与展望
参考文献
在学研究成果
致谢
Abstract of Thesis
论文摘要
本文编号:3221478
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3221478.html