基于大规模复杂网络的重叠社团检测算法研究
本文选题:网络聚类 切入点:重叠社团结构 出处:《安徽大学》2017年硕士论文
【摘要】:近年来,由于社交网络的发展和大数据时代的兴起,大规模复杂网络社团检测已成为研究热点之一。社团检测作为复杂网络研究中一项基础而又重要的工作,旨在挖掘网络中一组节点集合,这些集合内部的节点连接紧密,而集合之间的节点连接稀疏。然而在现实世界网络中经常存在一些节点可能会同时属于多个社团的情况,即重叠社团结构。因此,对重叠社团结构的检测更加重要且具有应用价值。随着网络科学的不断发展,许多复杂网络的规模甚至包含数百万数量的节点和数十亿条边。对如此大规模的复杂网络进行重叠社团挖掘一直是该领域内的难点之一。基于此,本文对大规模复杂网络重叠社团检测问题进行了深入研究,提出了一种基于弱团渗流思想的重叠社团检测算法。此外,为了解决数百万数量级的超大规模复杂网络重叠社团检测问题,本文还提出一种基于局部邻居信息的快速重叠社团检测算法。这两种算法均是以检测大规模复杂网络重叠社团结构为目的,相比较其他重叠社团检测算法,本文所提算法计算效率更快,社团检测精度更高。本文的主要研究工作如下:(1)本文提出了一种基于弱团渗流的重叠社团检测算法。k-团渗流方法是当前最常用的重叠社团检测算法之一,其基本思想是将社团结构定义为由一系列共享很多节点的完全连通子图组成。k-团渗流方法需要检测网络中所有k-团(即,k-clique),然而k-团的检测是NP完全问题,因此基于k-团渗流方法的时间复杂度很高。为了提高重叠社团检测算法在大规模复杂网络上检测重叠社团的效率和准确性,本文利用网络中的局部拓扑信息快速挖掘网络中的弱团。本文将弱团定义为由网络中两个关键节点及其公共邻居组合而成,由于仅仅利用节点的邻居信息,因此检测弱团要比检测k-团高效很多。同时在渗流过程中,提出新的相似度指标来衡量两个弱团之间的相似性,并以此来判断两个弱团是否应该合并,以提升算法的准确性。在新的相似度指标中不仅考虑了两个弱团之间共享的节点数目还统计了弱团之间边的连接数目。在LFR基准数据集和真实网络数据集上的实验结果表明,与现有几种重叠社团检测算法相比,基于弱团渗流的重叠社团检测算法在计算效率和发现重叠社团质量方面都具有明显优势。(2)本文提出一种基于局部邻居信息的快速重叠社团检测算法。随着社交网络的兴起和互联网时代的发展,目前复杂网络的规模变得越来越巨大。为了能够在数百万数量级这种超大规模复杂网络中检测重叠社团结构,本文提出了一种基于局部邻居信息的快速重叠社团检测算法,称之为OCLN(Overlapping Community detection by using Local-Neighborhood information)算法。OCLN 算法的基本思想在于首先利用网络中节点的内部度数和外部度数这些局部结构快速扩充社团,随后根据社团中每个节点的局部邻居信息在该社团中的贡献度计算节点的隶属度指标。从社团中删除掉一些隶属度较低的节点,提高算法的准确性。由于整个算法全部利用网络的局部结构,因此OCLN算法的时间复杂度为线性,即O(n+m),n为网络中节点的数目,m为边的数目。通过对LFR基准网络和大规模真实网络上的实验分析表明,OCLN算法在算法运行时间和NMI精度性能上都明显优于其他几种重叠社团检测算法。
[Abstract]:In recent years , because of the development of social networks and the rise of large data era , large - scale complex network community detection has become one of the hot topics . This paper proposes a fast overlapping community detection algorithm based on local neighbor information . With the rise of social network and the development of Internet age , the scale of complex network becomes more and more huge . In order to detect overlapping community structure in the large - scale complex network on the order of millions of orders , this paper proposes a fast overlapping community detection algorithm based on local neighbor information .
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O157.5
【相似文献】
相关期刊论文 前10条
1 刘晋霞;曾建潮;薛耀文;;复杂网络强社团结构探测[J];小型微型计算机系统;2011年04期
2 贾宁宁;封筠;;复杂网络的社团结构发现[J];河北省科学院学报;2013年02期
3 宣照国;苗静;党延忠;刘建国;;科研领域关联网络的社团结构分析[J];上海理工大学学报;2008年02期
4 王伊蕾;王远志;李涛;田生文;;伪度优先演化网络的社团结构研究[J];计算机工程与应用;2009年20期
5 汪小帆;刘亚冰;;复杂网络中的社团结构算法综述[J];电子科技大学学报;2009年05期
6 司夏萌;刘云;丁飞;熊菲;;具有社团结构的有界信任舆论涌现模型研究[J];系统仿真学报;2009年23期
7 谢军;;复杂网络中分析社团结构算法研究概述[J];信息通信;2010年04期
8 朱大勇;张新丽;李树全;;利用局部拓扑信息发现模糊社团结构[J];电子科技大学学报;2011年01期
9 邵斐;蒋国平;;基于社团结构的负载传输优化策略研究[J];物理学报;2011年07期
10 谈煜;梁润鹏;;一种基于层次化社团结构的网络可视化方法[J];微型电脑应用;2012年04期
相关会议论文 前5条
1 苗清影;汪小帆;;基于社团结构的复杂网络可控性研究[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
2 李晓佳;张鹏;狄增如;樊瑛;;复杂网络中的社团结构[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
3 胡延庆;赵尔波;张丹;狄增如;樊瑛;;社团结构的局域和自适应比较性定义及其相应探测方法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
4 吴文涛;肖仰华;何震瀛;汪卫;余韬;;基于权重信息挖掘社会网络中的隐含社团[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 樊瑛;李梦辉;张鹏;吴金闪;狄增如;;权重对网络结构和性质的影响——社团结构中权重的作用[A];2006全国复杂网络学术会议论文集[C];2006年
相关博士学位论文 前10条
1 程建军;复杂网络中的社团检测方法研究[D];兰州大学;2015年
2 李琳;基于多元统计分析的社团挖掘算法研究[D];上海交通大学;2014年
3 王文军;飞机驾驶舱人机工效设计与综合评估关键技术[D];西北工业大学;2015年
4 崔耀祖;基于复杂网络边的密度探索社团结构算法研究[D];大连理工大学;2016年
5 武志昊;复杂网络中的重叠社团发现问题研究[D];北京交通大学;2013年
6 魏芳;基于图挖掘的网络社团结构发现[D];复旦大学;2008年
7 刘传建;复杂网络中的社团结构划分及分析应用[D];山东大学;2014年
8 何东晓;复杂网络社团结构发现方法研究[D];吉林大学;2014年
9 刘晋霞;复杂网络社团结构的探测及其在资金融通网络中的应用研究[D];兰州理工大学;2013年
10 刘瑶;社会网络特征分析与社团结构挖掘[D];电子科技大学;2013年
相关硕士学位论文 前10条
1 刘微;复杂网络中社团结构的发现[D];辽宁师范大学;2011年
2 王大军;基于标签传播的社团检测算法研究[D];辽宁大学;2015年
3 杨强;微博社交网络模型的建立及其性质研究[D];北京化工大学;2015年
4 付世海;基于社团结构的网络多传播源定位算法研究[D];东北大学;2013年
5 马骁骑;复杂网络中社团检测技术研究[D];黑龙江大学;2015年
6 张献鹏;基于P4结构的社团挖掘方法[D];西安电子科技大学;2014年
7 陈奔燕;复杂网络的社团探测[D];湘潭大学;2015年
8 杜梅;基于半监督的社团结构发现方法研究[D];合肥工业大学;2014年
9 韩凌霄;复杂网络社团划分及城市公交网络研究[D];青岛理工大学;2015年
10 董哲;复杂网络中的社团发现算法研究[D];解放军信息工程大学;2014年
,本文编号:1685575
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1685575.html