当前位置:主页 > 科技论文 > 数学论文 >

基于核心区域扩展的重叠社区发现算法研究

发布时间:2018-04-10 02:20

  本文选题:社区发现 切入点:复杂网络 出处:《北京理工大学》2016年硕士论文


【摘要】:社区结构是复杂网络中一个常见的特性,它由一组连接紧密的结点组成,同时这些结点与社区外部结点连接稀疏。通过研究社区结构,研究者能够更深刻地理解网络所对应的复杂系统,因为社区结构往往揭示着网络的组织结构。同时,由于社区结构有着广泛的实际用途,所以在复杂网络中发现社区结构有着重要的研究意义。提出了一种衡量结点中心性的方法。基于结点核心值以及局部扩展框架,提出了一种新的重叠社区发现算法。该算法不仅能够发现重叠社区结构,同时还可发现网络中的部分桥接结点。该算法包括四个步骤:首先,根据结点的核心值将它们降序排序,以形成种子优先级列表;其次,列表顶端的结点被选出,以形成一个社区的核心区域;然后,扩展这个核心区域直到一个社区结构或者桥接结点被发现;最后,分配桥接结点到那些它的大多数邻居所在的社区中。其中,交替执行第二、第三步,直至所有社区都被发现,然后再进行第四步。实验结果证明了算法的有效性。针对当前已有的社区发现算法无法有效处理海量级数据的问题,提出了一种基于局部扩展的并行化算法,并且借助Spark框架将其实现。该算法包含四个步骤:首先,挑选出一组互不相关的中心结点并使用中心结点与它们的邻居所形成的局部网络作为种子;其次,通过删除那些本身连接比较稀疏的局部网络来过滤选出的种子;然后,采用一种批量式的扩展策略来扩展种子,即一次向局部社区中添加一批邻居结点或从社区中删除一批结点;最后,融合相似度比较高的社区。实验结果证明了算法的有效性。
[Abstract]:Community structure is a common feature in complex networks. It consists of a group of closely connected nodes which are sparsely connected to the external nodes of the community.By studying the community structure, researchers can understand the complex system of the network more deeply, because the community structure often reveals the organization structure of the network.At the same time, because community structure has a wide range of practical applications, it is of great significance to find community structure in complex networks.A method of measuring node centrality is proposed.A new overlapping community discovery algorithm is proposed based on node core values and local extension framework.The algorithm can not only find overlapping community structures, but also find some bridging nodes in the network.The algorithm consists of four steps: first, ranking the nodes in descending order according to their core values to form a seed priority list; secondly, the nodes at the top of the list are selected to form the core area of a community; then,The core area is extended until a community structure or bridging node is found; finally, the bridging node is allocated to the community where most of its neighbors live.Alternately, perform step two, step three, until all communities are found, and then step 4.Experimental results show that the algorithm is effective.Aiming at the problem that the existing community discovery algorithms can not deal with the massive data effectively, a parallelization algorithm based on local extension is proposed and implemented with the help of Spark framework.The algorithm consists of four steps: first, selecting a group of unrelated central nodes and using the local network formed by the center node and their neighbors as seeds; secondly,The selected seeds are filtered by deleting the local networks with sparse connections; then, a batch expansion strategy is used to extend the seeds.That is, adding a group of neighbor nodes to the local community or deleting a group of nodes from the community at a time. Finally, the communities with high similarity are fused.Experimental results show that the algorithm is effective.
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O157.5

【相似文献】

相关期刊论文 前10条

1 李德胜;张才仙;陈淑铭;;选择策略对进化算法性能的影响[J];科技资讯;2007年11期

2 梁民,孙仲康;多层前馈神经网络的快速学习算法及其仿真研究[J];系统工程与电子技术;1993年09期

3 王忠;陈伏虎;;基于阵元域数据的联合检测与跟踪算法[J];声学学报(中文版);2007年06期

4 苏开乐;关于D.W.Etherington的扩充产生算法的一个注记[J];计算机工程与科学;1998年04期

5 江宇闻;;Overcomplete ICA算法研究[J];中山大学研究生学刊(自然科学、医学版);2004年02期

6 王杰;王加银;;Mean Shift算法的收敛性讨论[J];北京师范大学学报(自然科学版);2008年05期

7 胡梦佑;陈钧量;;快速加权滑窗RLS格型算法[J];中山大学学报(自然科学版);1992年02期

8 裴炳南;吴显鼎;张明武;;MLMS算法的伪收敛现象[J];河南科学;1993年Z1期

9 张承慧;一种工业过程时变参数估计新算法——修正目标函数法[J];中国工程科学;2001年11期

10 丁海军;李峰磊;;蜂群算法在TSP问题上的应用及参数改进[J];中国科技信息;2008年03期

相关会议论文 前10条

1 何敏;陈中显;梅松涛;;蚁群算法的研究与进展[A];中国计量协会冶金分会2010年会论文集[C];2010年

2 高玮;;免疫连续蚁群算法[A];第二十六届中国控制会议论文集[C];2007年

3 唐乾玉;韩曾晋;;基于扰动分析的优化算法[A];1994中国控制与决策学术年会论文集[C];1994年

4 金成勋;周广禄;郭恒业;;对ICP算法中稳定采样的研究[A];立体图象技术及其应用研讨会论文集[C];2005年

5 陈元琰;闫友彪;罗晓曙;;REM算法的改进[A];广西计算机学会2005年学术年会论文集[C];2005年

6 范瑛;;改进蚁群算法结合BP网络用于入侵检测[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年

7 万丽芬;钟炎平;;约束LMS算法研究[A];第二十届电工理论学术年会论文集[C];2008年

8 云飞;薛青;姚义军;;改进型LMBP算法在军事数据分析中的应用研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年

9 朱双东;艾智斌;阎夏;;BP网络学习算法的改进方案探析[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年

10 唐乾玉;陈翰馥;韩曾晋;;串行生产线的参数优化[A];1994年中国控制会议论文集[C];1994年

相关博士学位论文 前10条

1 杨扩军;TIADC系统校准算法研究与实现[D];电子科技大学;2015年

2 黄亚魁;几类优化问题的BB型算法研究[D];西安电子科技大学;2015年

3 王戈;通信信号若干联合处理技术研究[D];解放军信息工程大学;2013年

4 王可心;大规模过程系统非线性优化的简约空间理论与算法研究[D];浙江大学;2008年

5 鲍吉锋;平衡问题和优化问题若干算法的收敛性分析[D];浙江大学;2013年

6 韩飞;基于先验信息编码的约束学习算法研究[D];中国科学技术大学;2006年

7 袁东辉;蚁群算法在飞行模拟器平台中若干应用问题的研究[D];吉林大学;2011年

8 厉丹;视频目标检测与跟踪算法及其在煤矿中应用的研究[D];中国矿业大学;2011年

9 滕月阳;正电子发射断层成像中的数学模型与算法[D];东北大学;2012年

10 张晓伟;全局优化的若干随机性算法[D];西安电子科技大学;2008年

相关硕士学位论文 前10条

1 杨展;城轨列车自动调整系统模型与算法研究[D];西南交通大学;2015年

2 马英钧;基于人工蜂群算法的约束优化问题研究[D];华中师范大学;2015年

3 钱其;电网谐波和间谐波功率的计量算法研究[D];中国科学技术大学;2015年

4 蒋玉冰;无线通信信号到达角跟踪算法研究[D];电子科技大学;2014年

5 孙方亮;基于粒子群与中心引力的一种新混合算法及应用[D];西安电子科技大学;2014年

6 于诗杰;基于无波前探测的大气光通信自适应补偿方法研究[D];西安电子科技大学;2014年

7 柯家龙;压缩感知算法及其在成像中的应用[D];南京邮电大学;2015年

8 刘光泓;并行磁共振图像全变分恢复一阶算法研究[D];南京邮电大学;2015年

9 张德祥;基于改进蚁群算法的机器人三维路径规划研究[D];青岛科技大学;2015年

10 张申利;基于蜂群算法的GIS优化选址及其并行化研究与应用[D];中国石油大学(华东);2014年



本文编号:1729233

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1729233.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7da84***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com