基于模糊密度峰值聚类的复杂网络社区发现研究
发布时间:2021-11-27 06:23
复杂网络中的社区发现研究对发现复杂网络中隐藏的规律和预测复杂网络的行为具有重要的意义,是近十几年的研究热点之一。许多聚类分析算法也被应用于社区发现中。密度峰值聚类算法(Clustering by Fast Search and Find of Density Peak,DPC)是一种简洁的基于密度的聚类算法。本文在DPC算法的基础上,提出一种截断距离参数和类簇中心自动选择策略,并结合模糊聚类思想探测复杂网络的社区结构。本文的主要工作如下:1、基于数据场与信息熵理论改进DPC算法。针对DPC算法需要人为地选择聚类中心,且不同阈值的选择对聚类结果影响大等缺点,提出了基于数据场与信息熵改进的算法(FDPC)。算法通过引入数据场理论指导阈值的自适应选取,并依据数据集的最大信息熵降低分割方法自动确定聚类中心,同时还进一步优化了离群点的检测条件。2、引入模糊聚类思想,结合FDPC算法发现复杂网络中的社区结构。首先,提出了一种新的节点距离度量方式,然后应用FDPC算法确定核心社区,再使用模糊聚类思想确定各点的隶属度,完成剩余节点的分配...
【文章来源】:武汉科技大学湖北省
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 复杂网络的社区发现研究现状
1.2.2 聚类分析研究现状
1.3 本文的主要工作
1.4 本文的结构安排
第2章 聚类分析与复杂网络的社区发现
2.1 聚类分析
2.1.1 聚类的相似性度量
2.1.2 聚类算法介绍
2.1.3 聚类算法评价指标
2.2 复杂网络的社区发现
2.2.1 复杂网络概念
2.2.2 社区发现算法
2.2.3 社区发现评价指标
2.3 本章小结
第3章 基于数据场与信息熵改进的密度峰值聚类算法
3.1 密度峰值聚类算法
3.2 密度峰值聚类算法的优化
3.2.1 基于数据场理论确定阈值
3.2.2 基于信息熵理论选择类簇中心
3.2.3 离群点检测
3.2.4 改进的密度峰值聚类算法步骤
3.3 对比实验分析
3.3.1 实验数据集
3.3.2 人工数据集实验对比
3.3.3 真实数据集实验对比
3.4 本章小结
第4章 基于模糊密度峰值聚类的复杂网络的社区发现
4.1 算法思想
4.1.1 计算距离矩阵
4.1.2 选择社区的核心节点
4.1.3 计算隶属度矩阵
4.1.4 区分重叠节点
4.1.5 CDFDPC算法步骤
4.2 对比实验分析
4.2.1 实验网络
4.2.2 人工网络实验对比
4.2.3 真实网络实验对比
4.3 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
附录1 攻读硕士学位期间发表的论文
详细摘要
【参考文献】:
期刊论文
[1]模糊谱聚类重叠社区发现算法[J]. 闫晓鹏,孙永波. 自动化仪表. 2016(03)
[2]一种改进的基于局部密度的聚类算法[J]. 关晓惠,钱亚冠,孙欣欣. 电信科学. 2016(01)
[3]数据科学与社会网络:大数据,小世界[J]. 汪小帆. 科学与社会. 2014(01)
[4]基于网格和信息熵的多密度聚类算法[J]. 周悦来,谭建豪. 计算机系统应用. 2011(10)
[5]一维Renyi熵阈值法中参数的自适应选取[J]. 雷博,范九伦. 光子学报. 2009(09)
[6]聚类有效性评价综述[J]. 杨燕,靳蕃,KAMEL Mohamed. 计算机应用研究. 2008(06)
[7]信息熵在数据集分割中的应用研究[J]. 苗卿,单立新,裘昱. 电脑知识与技术(学术交流). 2007(05)
[8]文本聚类算法的比较[J]. 李伟,黄颖. 科技情报开发与经济. 2006(22)
[9]基于减法聚类与聚类有效性评判的FCM聚类[J]. 张栒,邓辉文. 重庆工学院学报. 2006(05)
[10]一种基于数据场的层次聚类方法[J]. 淦文燕,李德毅,王建民. 电子学报. 2006(02)
博士论文
[1]聚类分析中若干关键技术的研究[D]. 杨小兵.浙江大学 2005
硕士论文
[1]基于密度的层次聚类算法研究[D]. 张文开.中国科学技术大学 2015
[2]基于密度峰值的重叠社区发现算法研究[D]. 冯国香.吉林大学 2015
[3]基于论文引用关系的学术社团发现方法及其研究[D]. 冯凯.华南理工大学 2016
[4]微博网络舆情热点生长分析模型研究[D]. 邱晨子.大连海事大学 2013
本文编号:3521722
【文章来源】:武汉科技大学湖北省
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 复杂网络的社区发现研究现状
1.2.2 聚类分析研究现状
1.3 本文的主要工作
1.4 本文的结构安排
第2章 聚类分析与复杂网络的社区发现
2.1 聚类分析
2.1.1 聚类的相似性度量
2.1.2 聚类算法介绍
2.1.3 聚类算法评价指标
2.2 复杂网络的社区发现
2.2.1 复杂网络概念
2.2.2 社区发现算法
2.2.3 社区发现评价指标
2.3 本章小结
第3章 基于数据场与信息熵改进的密度峰值聚类算法
3.1 密度峰值聚类算法
3.2 密度峰值聚类算法的优化
3.2.1 基于数据场理论确定阈值
3.2.2 基于信息熵理论选择类簇中心
3.2.3 离群点检测
3.2.4 改进的密度峰值聚类算法步骤
3.3 对比实验分析
3.3.1 实验数据集
3.3.2 人工数据集实验对比
3.3.3 真实数据集实验对比
3.4 本章小结
第4章 基于模糊密度峰值聚类的复杂网络的社区发现
4.1 算法思想
4.1.1 计算距离矩阵
4.1.2 选择社区的核心节点
4.1.3 计算隶属度矩阵
4.1.4 区分重叠节点
4.1.5 CDFDPC算法步骤
4.2 对比实验分析
4.2.1 实验网络
4.2.2 人工网络实验对比
4.2.3 真实网络实验对比
4.3 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
附录1 攻读硕士学位期间发表的论文
详细摘要
【参考文献】:
期刊论文
[1]模糊谱聚类重叠社区发现算法[J]. 闫晓鹏,孙永波. 自动化仪表. 2016(03)
[2]一种改进的基于局部密度的聚类算法[J]. 关晓惠,钱亚冠,孙欣欣. 电信科学. 2016(01)
[3]数据科学与社会网络:大数据,小世界[J]. 汪小帆. 科学与社会. 2014(01)
[4]基于网格和信息熵的多密度聚类算法[J]. 周悦来,谭建豪. 计算机系统应用. 2011(10)
[5]一维Renyi熵阈值法中参数的自适应选取[J]. 雷博,范九伦. 光子学报. 2009(09)
[6]聚类有效性评价综述[J]. 杨燕,靳蕃,KAMEL Mohamed. 计算机应用研究. 2008(06)
[7]信息熵在数据集分割中的应用研究[J]. 苗卿,单立新,裘昱. 电脑知识与技术(学术交流). 2007(05)
[8]文本聚类算法的比较[J]. 李伟,黄颖. 科技情报开发与经济. 2006(22)
[9]基于减法聚类与聚类有效性评判的FCM聚类[J]. 张栒,邓辉文. 重庆工学院学报. 2006(05)
[10]一种基于数据场的层次聚类方法[J]. 淦文燕,李德毅,王建民. 电子学报. 2006(02)
博士论文
[1]聚类分析中若干关键技术的研究[D]. 杨小兵.浙江大学 2005
硕士论文
[1]基于密度的层次聚类算法研究[D]. 张文开.中国科学技术大学 2015
[2]基于密度峰值的重叠社区发现算法研究[D]. 冯国香.吉林大学 2015
[3]基于论文引用关系的学术社团发现方法及其研究[D]. 冯凯.华南理工大学 2016
[4]微博网络舆情热点生长分析模型研究[D]. 邱晨子.大连海事大学 2013
本文编号:3521722
本文链接:https://www.wllwen.com/kejilunwen/yysx/3521722.html