基于少量选点的社团检测算法研究
本文关键词:基于少量选点的社团检测算法研究 出处:《兰州大学》2015年硕士论文 论文类型:学位论文
更多相关文章: 社团检测 层次凝聚 标签传播 半监督学习和主动学习
【摘要】:近年来,随着复杂网络数量的不断增多,复杂网络所涉及的领域不断扩大,对复杂网络性质的研究已经成为一门非常热门的课题。复杂网络通常具有一定的社团结构,即社团内部的关系紧密而社团与社团之间的关系稀疏,对应到网络图上就是社团内部的边多而社团与社团之间的边稀少。如何快速、有效地从复杂网络中获取社团结构,是大多学者研究的主要方向,也具有重要的应用价值。本文通过查阅相关的中外文献,对现有的社团检测算法进行研究,设计了两种新的社团发现算法:基于少量选点的层次凝聚社团检测算法(HCDFSN)和基于少量选点的主动半监督社团检测算法(ASCDFSN)。HCDFSN算法介绍了一种节点相似性度量方法、核心节点度量方法以及根据相似性处理社团间重叠节点的方法。该算法的大致思想为从核心节点出发来构建新的社团,直到所有核心节点用完为止;然后处理社团间重叠的部分;最后基于模块度对初始社团合并得到最终社团结构。HCDFSN算法通过初始社团形成方法和社团边界处理方法可以解决以下两个问题:(1)层次凝聚算法中社团边界节点一旦分错,不能重新划分问题;(2)层次凝聚算法中效果不理想问题。ASCDFSN算法介绍了一种得分计算方法、候选节点获取方法以及主动半监督策略。该算法的主要思想是通过得分计算方法获取候选点集合;再从候选节点中选取一部分节点,进行人工标记;最后使用半监督思想进行社团检测。ASCDFSN算法通过得分选取策略和主动半监督策略可以解决半监督算法中以下三个问题:(1)随机选取少量节点导致社团检测效果不佳问题;(2)选点经常不能覆盖所有社团问题。本文在多个真实网络数据集和一个人工合成网络数据集上进行实验,对算法运行的过程进行可视化展示。并通过与同类型算法的实验结果对比和复杂度分析表明,HCDFSN算法和ASCDFSN算法在社团检测上有较好的效果且效率较高。
[Abstract]:In recent years, with the increase of the number of complex networks, the field of complex networks is expanding. The study of the nature of complex networks has become a very hot topic. Complex networks usually have a certain community structure, that is, the relationships within the community are close and the relationship between the community and the community is sparse. Corresponding to the network diagram is that there are many edges within the community and there are few edges between the community and the community. How to quickly and effectively obtain the structure of the community from the complex network is the main research direction of most scholars. Also has the important application value. This article through the related domestic and foreign literature, carries on the research to the existing community detection algorithm. Two new community discovery algorithms are designed: HCDFSN-based hierarchical aggregation community detection algorithm based on a small number of selected points and ASCDFSN-based active semi-supervised community detection algorithm based on a small number of selected points. HCDFSN algorithm introduces a node similarity measurement method. The core node measurement method and the method of dealing with overlapping nodes between communities according to similarity. The general idea of this algorithm is to construct a new community from the core node until all the core nodes are exhausted. The overlapping parts of the community are then dealt with; Finally, based on modularity, the final community structure. HCDFSN algorithm can solve the following two problems: 1: 1 through the initial community formation method and the community boundary processing method. In hierarchical aggregation algorithm, community boundary nodes are partitioned. The problem cannot be reclassified; The problem of unsatisfactory effect in hierarchical aggregation algorithm. ASCDFSN algorithm introduces a method of score calculation. The main idea of this algorithm is to obtain the set of candidate points by the method of score calculation. Then selected some nodes from the candidate nodes to carry out manual marking; Finally, the semi-supervised algorithm is used for community detection. ASCDFSN algorithm can solve the following three problems in semi-supervised algorithm by the strategy of score selection and active semi-supervision. Selecting a small number of nodes at random leads to the poor effect of community detection. In this paper, experiments are carried out on multiple real network data sets and an artificial synthetic network data set. The operation process of the algorithm is visualized and compared with the experimental results of the same kind of algorithm and the complexity analysis shows that. HCDFSN algorithm and ASCDFSN algorithm have good effect and high efficiency in community detection.
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O157.5
【相似文献】
相关期刊论文 前10条
1 谢明霞;王家耀;郭建忠;陈科;;不等距划分的高维相似性度量方法研究[J];武汉大学学报(信息科学版);2012年07期
2 贺玲;吴玲达;蔡益朝;;高维空间中数据的相似性度量[J];数学的实践与认识;2006年09期
3 隋正伟;邬阳;刘瑜;;基于签到数据的用户空间出行相似性度量方法研究[J];地理信息世界;2013年03期
4 李海林;郭崇慧;;基于多维形态特征表示的时间序列相似性度量[J];系统工程理论与实践;2013年04期
5 杨艳春;孟祥武;;基于关键词的对等网络节点群相似性度量模型研究[J];武汉大学学报(理学版);2011年06期
6 李永宁;一种基于纹理的图象相似性度量模型(英文)[J];四川大学学报(自然科学版);2003年02期
7 胡茂海;;基于相关输出相似性度量的目标识别算法[J];中国激光;2012年04期
8 刘丹;卫金茂;张杰;;GO术语间语义相似性度量方法[J];东北师大学报(自然科学版);2010年01期
9 杜培军;唐宏;方涛;;高光谱遥感光谱相似性度量算法与若干新方法研究[J];武汉大学学报(信息科学版);2006年02期
10 郭铭铭;窦建华;杨彬;;基于形式化概念分析和概念相似性度量的程序重组方法(英文)[J];南京大学学报(自然科学版);2011年05期
相关会议论文 前10条
1 刘喜平;万常选;;一种二维的树型文档结构相似性度量[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 刘俊义;王润生;;仿射不变的多边形相似性度量[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
3 杨艳春;孟祥武;;P2P网络服务环境中的节点相似性度量研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 李彬彬;罗乐;;基于信源学的光谱相似性度量方法的比较研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 罗阳;赵伟;;相似性度量研究及最优相似系数[A];中国气象学会2008年年会天气预报准确率与公共气象服务分会场论文集[C];2008年
6 周晓蕾;唐明浩;於思俊;;服装款式系统中的相似性度量算法研究[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
7 刘宝生;闫莉萍;周东华;;图像匹配中相似性度量[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
8 李新光;郑君君;祝一薇;刘建军;夏胜平;谭立球;;基于属性图模型的图像相似性度量[A];第十五届全国图象图形学学术会议论文集[C];2010年
9 沈君;马生全;;两种新的相似性度量在模糊推理中的应用[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
10 廉鑫;林伟坚;张海威;袁晓洁;;基于双向路径约束模型的XML文档结构相似性度量[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
相关博士学位论文 前5条
1 白雪;聚类分析中的相似性度量及其应用研究[D];北京交通大学;2012年
2 张明;基于内容的图象相似性度量技术研究及其在水利中的应用[D];河海大学;2003年
3 邱明;语义相似性度量及其在设计管理系统中的应用[D];浙江大学;2006年
4 周瑜;视频跟踪中的目标建模及相似性度量研究[D];华中科技大学;2014年
5 戚文静;基于范例的图案创作关键技术研究[D];山东大学;2012年
相关硕士学位论文 前10条
1 曹莉莉;基于GC-MS的高速谱库搜索算法研究[D];安徽大学;2015年
2 蒋欣;基于粒子滤波的故障预报算法研究[D];福建师范大学;2015年
3 张豪;符号序列相似性度量及聚类新算法[D];福建师范大学;2015年
4 周汉海;基于少量选点的社团检测算法研究[D];兰州大学;2015年
5 黄_g;相似性度量的研究及其在数据挖掘中的应用[D];福建师范大学;2009年
6 练仕榴;生物医学信号的相似性度量研究[D];天津理工大学;2011年
7 朱波;程序代码相似性度量方法研究[D];长春工业大学;2015年
8 汤渊;面向词袋模型的相似性度量方法在特征降维中的应用[D];广东工业大学;2015年
9 孟晓峰;基于异质信息网络的相似性度量研究[D];北京邮电大学;2015年
10 郑斐;时间序列相似性度量方法及其在生理信息挖掘中的应用[D];北京交通大学;2012年
,本文编号:1425057
本文链接:https://www.wllwen.com/kejilunwen/yysx/1425057.html