当前位置:主页 > 科技论文 > 数学论文 >

基于广义后缀树的二分网络社区挖掘算法

发布时间:2018-10-26 11:28
【摘要】:近年来,二分网络的社区挖掘问题得到了极大的关注。提出了一种基于广义后缀树的二分网络社区挖掘算法。首先从二分网络的邻接矩阵中提取网络中每个节点的链接节点序列,然后构建广义后缀树。广义后缀树的每个节点表示二分网络的一个完全二分团,由此获取并调整完全二分团。通过引入二分团的紧密度得到初始的社区划分,最后再对孤立点进行处理以得到最终的社区划分。所提算法不仅能发现重叠社区,而且能得到一对多关系的社区。在人工数据集和真实数据集上的实验表明,所提算法能准确地识别二分网络中的社区个数,获得很好的划分效果。
[Abstract]:In recent years, the community mining problem of bipartite network has been paid great attention to. A community mining algorithm based on generalized suffix tree is proposed in this paper. Firstly, the linked node sequence of each node in the network is extracted from the adjacency matrix of the binary network, and then the generalized suffix tree is constructed. Each node of the generalized suffix tree represents a complete dichotomy of a bipartite network, from which a complete dichotomy is obtained and adjusted. The initial community division is obtained by introducing the compactness of dichotomies, and then the isolated points are treated to obtain the final community division. The proposed algorithm can not only find overlapping communities, but also obtain one-to-many communities. Experiments on artificial data sets and real data sets show that the proposed algorithm can accurately identify the number of communities in the binary network and obtain a good partition effect.
【作者单位】: 金陵科技学院信息化建设与管理中心;扬州大学信息工程学院;南京大学计算机软件新技术国家重点实验室;南京航空航天大学计算机科学与技术学院;
【基金】:国家自然科学基金项目(61379066) 江苏省高校自然科学基金项目(15KJD520008) 江苏省现代教育技术研究重点课题(2017-R-54927)资助
【分类号】:O157.5

【相似文献】

相关期刊论文 前2条

1 胡海龙;孙晨;赫枫龄;左万利;;基于改进后缀树算法中英文聚类引擎的实现[J];吉林大学学报(理学版);2009年02期

2 ;[J];;年期

相关会议论文 前1条

1 务孟庆;高军;王腾蛟;杨冬青;;WD-STC:一种基于网络词典的WEB新闻文档后缀树聚类算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年

相关硕士学位论文 前10条

1 李双江;基于压缩后缀数组的空间高效短读比对算法[D];西安电子科技大学;2014年

2 陈智达;支持字符串局部比对的内存及外存优化方法[D];东北大学;2013年

3 王哲;面向基因组的高效FM-index构造算法[D];西安电子科技大学;2015年

4 郭海涛;用加强的后缀数组查找MUM[D];西安电子科技大学;2007年

5 王学;基因组中最大唯一匹配的查找算法研究[D];西安电子科技大学;2009年

6 王坚;基于后缀数组的滑动窗口匹配压缩改进算法研究[D];华中科技大学;2012年

7 陈月妥;一种新型后缀数组构造外存算法的性能优化技术[D];中山大学;2014年

8 荣元媛;改进后缀树的中文检索结果聚类系统[D];北京林业大学;2013年

9 董丽霞;基因组比对中若干改进算法研究[D];西安电子科技大学;2009年

10 唐德昌;基于串核的蛋白质分类算法的研究与实现[D];哈尔滨工业大学;2008年



本文编号:2295567

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2295567.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f53ba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com