聚类分析及其在社交网络中的应用研究
发布时间:2023-03-16 19:35
聚类分析作为一种无监督学习方法,是机器学习领域重要的研究方向之一,已经成功应用到金融、商业、社交网络、生物信息学等领域。目前存在大量成熟有效的聚类算法,其中基于图论的谱聚类算法,具有能够划分任意形状数据、易于执行等优点,受到广泛的关注。然而,谱聚类算法的计算复杂度和空间开销比较大,对大规模数据集来说是难以承受的计算负担。另一方面,以互联网为代表的信息技术的快速发展,导致社交网络研究需求越来越迫切。利用聚类手段分析现实中的社交网络,已经成为一种重要有效的研究方法。本文研究谱聚类算法的可拓展性,并将改进的谱聚类算法应用到大规模社交网络的社区检测中,主要的研究内容包含以下四个方面:(1)针对多数谱聚类算法通常以距离决定数据之间的相似性导致聚类效率低的问题,提出了一种公理化模糊共享近邻自适应谱聚类算法。首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来构造更合适的相似度矩阵,然后采用共享近邻的方法根据每个点所处邻域的稠密程度自动调节尺度参数,进一步提高聚类准确率。仿真实验表明:相较于距离谱聚类、自适应谱聚类、模糊聚类方法和地标点谱聚类,改进算法能取得更好的聚类效果。(2)针对...
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 谱聚类研究概述
1.2.2 社交网络研究概述
1.3 主要内容简介及组织结构
第二章 改进的模糊谱聚类算法
2.1 基于距离度量的谱聚类算法
2.2 公理化模糊共享近邻谱聚类算法
2.2.1 基于公理化模糊理论构造相似性度量
2.2.2 在模糊空间上建立距离度量
2.2.3 改进算法的提出
2.3 实验结果与分析
2.3.1 实验数据集与评价指标
2.3.2 实验结果与分析
2.4 本章小结
第三章 改进地标点表示的自编码谱聚类算法
3.1 基于地标点的谱聚类算法
3.2 改进地标点表示的自编码谱聚类算法
3.2.1 基于加权Page Rank算法的地标选择过程
3.2.2 自编码器与聚类优化过程
3.2.3 改进算法的提出
3.2.4 算法步骤及复杂度分析
3.3 实验结果与分析
3.3.1 实验算法及数据集
3.3.2 实验结果与分析
3.4 本章小结
第四章 基于不完全Cholesky分解的半监督谱聚类算法
4.1 半监督Ncut谱聚类算法
4.2 改进的半监督谱聚类算法
4.2.1 构建不完全Cholesky分解的相似度矩阵
4.2.2 停止准则与特征值衰减问题
4.2.3 改进算法的提出
4.3 实验结果与分析
4.3.1 实验数据集与评价指标
4.3.2 实验结果与分析
4.4 本章小结
第五章 基于聚类分析方法的社区检测
5.1 社区检测算法
5.2 基于改进聚类的社区检测
5.2.1 改进的模块化Q函数
5.2.2 基于改进谱聚类算法的大规模社区检测
5.3 实验结果与分析
5.3.1 实验数据集与评价指标
5.3.3 实验结果分析
5.4 本章小结
第六章 总结与展望
致谢
参考文献
附录:作者在攻读硕士学位期间发表的论文
本文编号:3763187
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 谱聚类研究概述
1.2.2 社交网络研究概述
1.3 主要内容简介及组织结构
第二章 改进的模糊谱聚类算法
2.1 基于距离度量的谱聚类算法
2.2 公理化模糊共享近邻谱聚类算法
2.2.1 基于公理化模糊理论构造相似性度量
2.2.2 在模糊空间上建立距离度量
2.2.3 改进算法的提出
2.3 实验结果与分析
2.3.1 实验数据集与评价指标
2.3.2 实验结果与分析
2.4 本章小结
第三章 改进地标点表示的自编码谱聚类算法
3.1 基于地标点的谱聚类算法
3.2 改进地标点表示的自编码谱聚类算法
3.2.1 基于加权Page Rank算法的地标选择过程
3.2.2 自编码器与聚类优化过程
3.2.3 改进算法的提出
3.2.4 算法步骤及复杂度分析
3.3 实验结果与分析
3.3.1 实验算法及数据集
3.3.2 实验结果与分析
3.4 本章小结
第四章 基于不完全Cholesky分解的半监督谱聚类算法
4.1 半监督Ncut谱聚类算法
4.2 改进的半监督谱聚类算法
4.2.1 构建不完全Cholesky分解的相似度矩阵
4.2.2 停止准则与特征值衰减问题
4.2.3 改进算法的提出
4.3 实验结果与分析
4.3.1 实验数据集与评价指标
4.3.2 实验结果与分析
4.4 本章小结
第五章 基于聚类分析方法的社区检测
5.1 社区检测算法
5.2 基于改进聚类的社区检测
5.2.1 改进的模块化Q函数
5.2.2 基于改进谱聚类算法的大规模社区检测
5.3 实验结果与分析
5.3.1 实验数据集与评价指标
5.3.3 实验结果分析
5.4 本章小结
第六章 总结与展望
致谢
参考文献
附录:作者在攻读硕士学位期间发表的论文
本文编号:3763187
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3763187.html