社区发现算法的研究及其在代码托管平台的应用

发布时间:2018-02-25 15:38

  本文关键词: 社交网络 复杂网络 社区发现 网络爬虫 出处:《西南交通大学》2017年硕士论文 论文类型:学位论文


【摘要】:互联网技术的发展,推动着诸如微博、知乎、Facebook、Twitter等在线社交媒体的快速发展,从而形成了巨大的社交网络。社交网络是人们真实世界的一种延伸,符合真实社会的某些特征,能够反映人们的社会属性和偏好,研究如何从这类网络中发现有价值的潜在社区成了近年来的热点。与此同时,以Git和开源项目为基础的代码托管平台也蓬勃发展起来,随着越来越多开发者的参与,形成了庞大的开发者网络社区。不可否认,开发者是互联网科技快速发展的中坚力量,研究如何帮助开发者更好的交流和协作具有十分重要的意义。本文以最具代表性的代码托管平台——GitHub为研究对象,提出了一套基于代码托管平台的社区发现方法。首先基于GitHub网站爬取到的数据,提出了一种基于代码仓库编程语言类型的用户建模方法;并在此基础上设计了一种构建网络拓扑图的方法;然后对传统FastUnfolding算法进行改进,并对所构建的网络拓扑图进行社区发现研究。本文主要工作包括如下几方面:1.完成定向网络爬虫的设计,利用网络爬虫收集网页数据,并进行预处理操作,获得实验数据。2.基于代码仓库的编程语言类型,提出一种用户建模的方法,并给出了两个用户模型之间边的定义以及边权重的计算方法,完成带权网络拓扑图的构建。3.对传统的社区发现算法进行研究,针对传统FastUnfolding算法在每次迭代计算边权的过程中忽略了部分节点特性的问题,提出一种基于重构用户模型的权重计算方法。实验结果表明,改进的算法对社区划分结果的模块度Q值有一定的提升。在实验统计分析的基础上,提出了一种简化的用户模型,对比实验结果表明,简化模型可以获得更高的模块度Q值。4.设计并实现了基于社区划分结果的推荐系统,该系统实现了社区划分结果和用户模型的可视化展示,并可为用户推荐其所在社区的其他用户以及与其他用户相关的代码仓库信息。
[Abstract]:......
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;O157.5

【参考文献】

相关期刊论文 前10条

1 周小平;梁循;张海燕;;基于R-C模型的微博用户社区发现[J];软件学报;2014年12期

2 蔡波斯;陈翔;;基于行为相似度的微博社区发现研究[J];计算机工程;2013年08期

3 何翔;顾春华;丁军;;基于微博的主题社区发现[J];计算机应用与软件;2013年06期

4 封海岳;薛安荣;;基于重叠模块度的社区离群点检测[J];计算机应用与软件;2013年05期

5 闫光辉;舒昕;马志程;李祥;;基于主题和链接分析的微博社区发现算法[J];计算机应用研究;2013年07期

6 方平;李芝棠;涂浩;郭正彪;;复杂网络局部社区挖掘的节点接近度算法[J];计算机工程与应用;2013年17期

7 王莉军;杨炳儒;翟云;谢永红;;动态社区发现算法的研究进展[J];计算机应用研究;2011年09期

8 黄发良;肖南峰;;基于线图与PSO的网络重叠社区发现[J];自动化学报;2011年09期

9 张聪;沈惠璋;李峰;;复杂网络中社团结构划分的快速分裂算法[J];计算机应用研究;2011年04期

10 黄发良;;信息网络的社区发现及其应用研究[J];复杂系统与复杂性科学;2010年01期



本文编号:1534140

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1534140.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1f5e6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com