基于概率模型的社会网络链接预测研究
本文关键词:基于概率模型的社会网络链接预测研究,,由笔耕文化传播整理发布。
【摘要】:链接预测作为社会网络分析领域的一个研究方向,目的在于预测不相连节点对之间存在链接的可能性。其在社会学、生物信息学和电子商务等邻域具有重要的理论研究价值和广泛的应用价值。目前,已有的链接预测算法大部分基于网络的拓扑结构定义相似性指标(如:CN、AA和LHN-II等)来构造,该类算法模型简单,无法刻画挖掘网络深层次结构信息。因此,本文以简单无权网络为研究基础,从下面两个主要方面探讨这一问题:第一,针对朴素贝叶斯模型中独立性假设的薄弱环节,引入隐朴素贝叶斯模型;并将隐朴素贝叶斯的特点与链接节点对共邻节点所组成的网络进行结合,通过引入互信息强化二者之间的联系,得到了基于隐贝叶斯模型的社会网络链接预测算法。在四个真实社会网络数据集Ca-GrQr、Facebook、Eron和Advogato上的实验结果表明:与朴素贝叶斯链接预测模型相比,基于隐贝叶斯的链接预测模型具有更高的AUC和Precision。第二,从定性的角度,对相似性指标进行具体的分析,结合实际将这些指标归为网络中链接的结构特征。受这些特征的启发,构造出了新的结构特征Cohesion指标,通过对比实验说明了该特征的有效性。在此基础上,从机器学习的角度,对这些特征进行选择,并建立基于分类器效果评价指标的特征选择性能评价体系。在特征选择与效果评价的过程中,通过先用KMEANS聚类,再按聚类结果抽样的策略,解决其中所涉及的不平衡性问题。在Twitter、Facebook、Jazz和Email四个数据集上进行实验,实验结果显示本文所提出的方法和模型是有效的,在评价体系中的ACC、REC、PPV、F1-score和AUC五个指标整体上有更优的表现,并有较好的拓展性。此外,基于上述研究,本文把朴素贝叶斯链接预测模型向加权网络进行了拓展。这种拓展主要是建立在社会网络链接结构特征选择模型框架的基础之上,介绍了含权特征;并重点研究了在包括含权特征情况时,不同分类器的性能表现。实验显示本次拓展工作存在一定的可行性。
【关键词】:社会网络 链接预测 隐朴素贝叶斯 特征选择 不平衡问题
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.8;TP181
【目录】:
- 摘要5-6
- Abstract6-11
- 第一章 绪论11-16
- 1.1 研究背景及其意义11-12
- 1.2 国内外研究现状12-14
- 1.2.1 基于节点属性的链接预测12-13
- 1.2.2 基于相似性的链接预测13-14
- 1.3 本文研究目标14
- 1.4 本文的组织结构14-16
- 第二章 相关概念与理论16-27
- 2.1 社会网络简介16-17
- 2.2 链接预测17-20
- 2.2.1 问题描述17-19
- 2.2.2 算法性能评价指标19-20
- 2.3 相关模型20-26
- 2.3.1 基于相似性指标的模型20-21
- 2.3.2 本文涉及的机器学习算法21-26
- 2.4 本章小结26-27
- 第三章 隐朴素贝叶斯模型的链接预测27-37
- 3.1 相关工作27
- 3.2 朴素贝叶斯链接预测模型27-29
- 3.3 隐贝叶斯链接预测模型29-33
- 3.3.1 Hidden Na?ve Bayesian Model29
- 3.3.2 基于隐贝叶斯的链接预测模型(HNB)29-31
- 3.3.3 模型推广31-32
- 3.3.4 算法框架32-33
- 3.4 实验结果33-35
- 3.4.1 实验准备33
- 3.4.2 结果说明33-35
- 3.5 本章小结35-37
- 第四章 社会网络链接结构特征选择37-53
- 4.1 相关工作37-39
- 4.1.1 不平衡分类问题37-38
- 4.1.2 特征选择38-39
- 4.2 社会网络链接结构特征选择模型39-45
- 4.2.1 问题分析39-40
- 4.2.2 特征评价40-43
- 4.2.3 社会网络链接结构特征选择模型43-44
- 4.2.4 算法框架44-45
- 4.3 实验结果45-51
- 4.3.1 实验准备45-46
- 4.3.2 结果说明46-51
- 4.4 本章小结51-53
- 第五章 基于含权特征的社会网络链接预测53-60
- 5.1 加权网络简介53-56
- 5.1.1 加权网络表示方法53-54
- 5.1.2 含权特征54-56
- 5.2 基于含权特征的社会网络链接预测模型56-57
- 5.2.1 分析与准备56
- 5.2.2 基于含权特征的社会网络链接预测模型56-57
- 5.2.3 算法框架57
- 5.3 实验结果57-59
- 5.3.1 实验准备57
- 5.3.2 结果说明57-59
- 5.4 本章小结59-60
- 总结与展望60-62
- 参考文献62-66
- 攻读硕士学位期间取得的研究成果66-67
- 致谢67-68
- 附件68
【相似文献】
中国期刊全文数据库 前2条
1 关玉蓉;伍明星;;基于DLL和API的Internet链接器设计[J];科技广场;2008年10期
2 ;[J];;年期
中国重要报纸全文数据库 前8条
1 赵福军;网络链接:徘徊在共享与违法的边缘[N];中国文化报;2005年
2 刘 勇;网络链接中侵权行为的界定[N];人民法院报;2005年
3 北京市海淀区人民法院法官 杨德嘉 陈敏;网络链接服务能否为侵权“免单”[N];中国新闻出版报;2011年
4 Softer;为何不能建立网络链接[N];电脑报;2004年
5 周彩云;法院认定:未经授权提供链接也属侵权[N];中国新闻出版报;2004年
6 本报记者撰述;青少年爱酷 零售商攻心[N];亚太经济时报;2005年
7 杨德嘉 陈敏;怎样判断网络链接是否侵权[N];中国艺术报;2010年
8 邵薇 译;Simply Accounting Pro:财务软件[N];北京科技报;2002年
中国博士学位论文全文数据库 前1条
1 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 罗泳诗;论网络链接的著作权侵权判定标准[D];华南理工大学;2015年
2 徐宏;基于概率模型的社会网络链接预测研究[D];华南理工大学;2016年
3 仇天成;网络链接引发的商标侵权法律责任研究[D];苏州大学;2014年
4 金磊;关于网络链接的法律问题分析[D];北京大学;2006年
5 夏韬;在线社交网络信息传播对网络链接形成的影响研究[D];北京邮电大学;2013年
6 陈智丽;网络链接行为侵权责任研究[D];上海交通大学;2009年
7 卫蕾;网络链接法律问题研究[D];山东大学;2012年
8 补嘉;基于LDA的社交网络链接预测模型研究[D];西南大学;2012年
9 何敏;网络链接滥用引发的知识产权问题研究[D];复旦大学;2009年
10 禹贵军;网络链接服务提供商的民事责任研究[D];内蒙古大学;2010年
本文关键词:基于概率模型的社会网络链接预测研究,由笔耕文化传播整理发布。
本文编号:456198
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/456198.html