高维数据子空间聚类方法
发布时间:2023-09-17 07:12
受到“维度灾难”的影响,高维数据的聚类效率与聚类结果的精度难以得到保证。为了降低“维度灾难”对聚类结果的影响,采用子空间聚类算法,生成高维数据集的子空间,并将在子空间中聚类得到的结果作为数据分析的依据。这一过程中子空间的质量是保证子空间聚类算法有效性的关键,有两种提高子空间质量的方法,一是在子空间生成的过程中制定有效的生成规则,二是在子空间生成之后根据相应的筛选策略精简子空间。本文同时采用以上两种方法,首先采用高维数据中维度密度高的维度生成子空间。其次在子空间内自适应地生成网格,根据网格密度精简子空间内的数据。之后再次根据维度密度将子空间内的低密度维度剪枝,以提高子空间的质量。聚类过程中采用网格聚类的方法,根据网格的邻接性对子空间聚类。实验证明该算法在UCI(University of California-Irvine)数据集上能得到较好的实验结果,并且在抗噪声能力,伸缩性以及效率实验中都能产生良好的实验结果。针对高维数据中有存在不确定数据的情况,为了避免不确定数据对高维数据聚类结果造成影响,提出高维不确定数据的子空间聚类算法,分别针对高维不确定数据中维度不确定与值不确定的情况提出相...
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景和意义
1.2 国内外现状研究分析
1.3 课题来源及研究内容
1.3.1 课题的来源
1.3.2 课题的主要研究内容
第2章 聚类分析技术介绍
2.1 聚类分析的概念与聚类过程
2.2 高维数据以及聚类方法介绍
2.2.1 降维方法介绍
2.2.2 Clique算法
2.3 不确定数据以及聚类方法介绍
2.3.1 不确定数据的相似度表示
2.3.2 不确定数据聚类方法
2.4 本章小结
第3章 高维高密度子空间聚类算法
3.1 基于hoeffding界子空间生成算法
3.2 基于凝聚的不规则网格算法
3.3 基于子空间相似的剪枝算法
3.4 基于分类比较的聚类算法
3.5 实验与分析
3.6 本章小结
第4章 高维不确定数据的子空间聚类算法
4.1 KNN算法
4.2 维度不确定聚类算法
4.2.1 部分数据维度不确定的子空间聚类算法
4.2.2 数据集维度不确定子空间聚类算法
4.3 值不确定子空间聚类算法
4.3.1 数据值模糊聚类
4.3.2 数据值缺失聚类
4.4 基于子空间的复杂高维不确定数据聚类算法
4.5 实验与分析
4.6 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢
本文编号:3847252
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景和意义
1.2 国内外现状研究分析
1.3 课题来源及研究内容
1.3.1 课题的来源
1.3.2 课题的主要研究内容
第2章 聚类分析技术介绍
2.1 聚类分析的概念与聚类过程
2.2 高维数据以及聚类方法介绍
2.2.1 降维方法介绍
2.2.2 Clique算法
2.3 不确定数据以及聚类方法介绍
2.3.1 不确定数据的相似度表示
2.3.2 不确定数据聚类方法
2.4 本章小结
第3章 高维高密度子空间聚类算法
3.1 基于hoeffding界子空间生成算法
3.2 基于凝聚的不规则网格算法
3.3 基于子空间相似的剪枝算法
3.4 基于分类比较的聚类算法
3.5 实验与分析
3.6 本章小结
第4章 高维不确定数据的子空间聚类算法
4.1 KNN算法
4.2 维度不确定聚类算法
4.2.1 部分数据维度不确定的子空间聚类算法
4.2.2 数据集维度不确定子空间聚类算法
4.3 值不确定子空间聚类算法
4.3.1 数据值模糊聚类
4.3.2 数据值缺失聚类
4.4 基于子空间的复杂高维不确定数据聚类算法
4.5 实验与分析
4.6 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢
本文编号:3847252
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3847252.html
最近更新
教材专著