异质网络中重叠社区发现技术研究
发布时间:2017-09-26 22:44
本文关键词:异质网络中重叠社区发现技术研究
更多相关文章: 异质网络 重叠社区发现 网络转化模型 信息扩散
【摘要】:作为数据挖掘中一个正在蓬勃发展的研究领域,复杂网络分析正引起越来越多研究人员的关注。社区发现是复杂网络研究中一项十分重要的基础性工作,它可以为复杂网络的分析与研究提供中观尺度的视角,这为研究人员研究复杂网络带来了巨大的便利。传统社区发现技术的研究工作大多以复杂网络中的同质网络作为研究对象,假定网络中的所有实体是同种类型的,这确为社区发现工作带来了方便,但这种假设背离了网络的真实情形,真实网络中,不论结点抑或是边,它们的类型都可以是多种多样的,这就对研究过程中针对现实网络的抽象方式提出了新的要求,异质网络这一概念也就应运而生了,它对网络中不同类型的边和结点加以区分,以更加贴近实际的方式描述了网络的结构与组成。同时,社区的重叠现象广泛存在于真实网络中,由此也激发了一个新的研究方向,即针对复杂网络的重叠社区发现技术研究,重叠社区结构更准确地描述了网络中真实的中观结构信息,因此,复杂网络重叠社区发现具有更加突出的现实意义。本文以异质网络为研究对象,试图寻找一种能够有效发现存在于异质网络中的重叠社区结构的方法,为此,本文完成了如下主要工作:第一,介绍并分析了复杂网络和社区结构的基本概念与特点,对使用较为广泛的三类异质网络社区发现技术进行了简单介绍。异质网络以其特有的性质为针对异质网络的社区发现技术的研究带来了巨大挑战。第二,通过对重叠社区结构性质和常用异质网络社区发现技术的分析,确定了本课题的研究思路。第三,结合机器学习领域中的半监督学习方法,设计并实现了一种将多维异质网络转化为同质网络的数学模型。该模型对原始多维异质网络各维度重新进行组合,使用组合后的关系作为与其对应的同质网络的关系,这里,为达到区别对待网络中各维度的目的,模型采用了为不同重要性的维度分配不同权重的方式,模型的核心任务就是确定此权重向量(系数向量)。第四,在综合对比分析当前主要的重叠社区发现算法的基础上,结合信息论的相关知识,给出了一种基于信息扩散的社区定义,并进一步借鉴信息传播理论与标签传播算法的主要思想,从单个结点对关于某种主题的信息的掌握程度出发,提出了一种复杂网络重叠社区发现算法。算法以结点实际接受了的信息量作为衡量标准判断该结点是否会加入到由该主题所代表的社区中。第五,基于实际数据集分别对本文所提出的网络转换模型和重叠社区发现算法进行了实验测试及分析,利用Matlab完成了网络转化模型的测试实验,利用Java语言和UCINet工具实现了社区发现算法部分的测试及结果可视化。在通过实验验证了网络转换模型和社区发现算法的有效性的基础上,以DBLP数据集作为测试对象构建多维异质网络,而后设计并实现了将网络转换模型同社区发现算法的集成实验,并对实验结果进行了分析。
【关键词】:异质网络 重叠社区发现 网络转化模型 信息扩散
【学位授予单位】:兰州交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O157.5
【目录】:
- 摘要4-6
- Abstract6-10
- 1 绪论10-17
- 1.1 研究背景及意义10-13
- 1.1.1 研究背景10-11
- 1.1.2 研究意义11-13
- 1.2 国内外研究现状13-15
- 1.2.1 国内研究现状13-14
- 1.2.2 国外研究现状14-15
- 1.3 论文的主要研究工作及创新点15-16
- 1.4 本文结构16-17
- 2 复杂网络与异质网络中的社区发现技术17-28
- 2.1 复杂网络17-22
- 2.1.1 复杂网络概述17-20
- 2.1.2 同质网络20-21
- 2.1.3 异质网络21-22
- 2.2 社区结构及其定义22-25
- 2.2.1 非重叠社区24
- 2.2.2 重叠社区24-25
- 2.3 异质网络中的社区发现技术25-27
- 2.3.1 将异质网络转化为同质网络25-26
- 2.3.2 不同类型实体的同步聚类26-27
- 2.3.3 基于属性实体的目标实体聚类27
- 2.4 小结27-28
- 3 基于半监督学习的多维异质网络转化模型28-35
- 3.1 异质网络转化为同质网络的主要方法28-30
- 3.1.1 网络集成28-29
- 3.1.2 效用集成29-30
- 3.2 建模基础与模型构建30-34
- 3.2.1 半监督学习30
- 3.2.2 相关数学基础知识30-31
- 3.2.3 网络转化模型的构建31-34
- 3.3 小结34-35
- 4 基于信息扩散的复杂网络重叠社区发现算法35-45
- 4.1 算法概述35-43
- 4.1.1 查找网络中对信息掌握程度最高的结点37-38
- 4.1.2 构建主题结点集合38-39
- 4.1.3 结点对所接收到的信息的接受程度分析39-41
- 4.1.4 算法结束运行条件41
- 4.1.5 参数t的确定41-43
- 4.1.6 社区发现结果提取43
- 4.2 算法收敛性分析43-44
- 4.3 算法时间复杂度分析44
- 4.4 小结44-45
- 5 实验结果与分析45-55
- 5.1 异质网络转化模型实验及测试45-48
- 5.1.1 实验数据集45-47
- 5.1.2 实验测试与结果47-48
- 5.2 社区发现算法实验及分析48-52
- 5.2.1 实验数据集48-49
- 5.2.2 实验效果评价标准49
- 5.2.3 社区发现结果展现与分析49-52
- 5.3 集成测试实验52-54
- 5.3.1 实验数据集及多维网络构建52
- 5.3.2 实验测试与结果52-54
- 5.4 小结54-55
- 结论55-57
- 致谢57-58
- 参考文献58-61
- 攻读学位期间的研究成果61
【参考文献】
中国期刊全文数据库 前10条
1 龚尚福;陈婉璐;贾澎涛;;层次聚类社区发现算法的研究[J];计算机应用研究;2013年11期
2 封海岳;薛安荣;;基于重叠模块度的社区离群点检测[J];计算机应用与软件;2013年05期
3 刘大有;金弟;何东晓;黄晶;杨建宁;杨博;;复杂网络社区挖掘综述[J];计算机研究与发展;2013年10期
4 张伟;汲长飞;童向荣;;复杂网络中的二阶邻居网络[J];吉林大学学报(工学版);2013年02期
5 康旭彬;贾彩燕;;一种改进的标签传播快速社区发现方法[J];合肥工业大学学报(自然科学版);2013年01期
6 张俊丽;常艳丽;师文;;标签传播算法理论及其应用研究综述[J];计算机应用研究;2013年01期
7 林旺群;邓镭;丁兆云;吴泉源;贾焰;周斌;;一种新型的层次化动态社区并行计算方法[J];计算机学报;2012年08期
8 李稚楹;杨武;谢治军;;PageRank算法研究综述[J];计算机科学;2011年S1期
9 赵卓翔;王轶彤;田家堂;周泽学;;社会网络中基于标签传播的社区发现新算法[J];计算机研究与发展;2011年S3期
10 何东晓;周栩;王佐;周春光;王U,
本文编号:926184
本文链接:https://www.wllwen.com/kejilunwen/yysx/926184.html