基于复杂网络的谣言源挖掘方法研究
发布时间:2017-09-24 00:04
本文关键词:基于复杂网络的谣言源挖掘方法研究
更多相关文章: 谣言源挖掘 概率距离 源中心性 传播子图 观察点部署
【摘要】:随着因特网的普及,信息呈现爆炸式增长,信息传播速度也非常容易形成级联效应,因此包括社交网络在内的各种复杂网络场景下的异常信息传播控制显得非常重要,尤其是针对谣言虚假信息的控制。如今网络中的异常信息特别是谣言信息大量充斥在网络环境中,严重影响了各方的合法利益,造成了社会的恐慌,因此对于这类谣言信息的扩散控制非常有必要。在控制扩散方面,如果我们可以准确的挖掘出信息扩散的源点,这对于合理有效的控制谣言扩散具有重要的应用价值和现实意义。挖掘的难点是如何根据现有的有限节点信息准确的在图中找到信息源点的位置,传播路径以及传播关系是未知的,时间信息也是处于未知状态的。现有的挖掘方法大多分为两种类型,一种是基于传播子图场景下的挖掘,该类方法要求获得谣言感染网络的完整传播子图,对现实要求较高,准确率相对较高;另一种是基于观察点部署场景下的挖掘,该类方法不要求获得完整的传播子图,只需要获得部分感染节点的情况,即可对其进行数据挖掘,最终得到的准确率也会相对偏低。通过对谣言源挖掘问题以及现有的模型分析,本文从以下几个方面进行研究:第一,通过对前人提出的RC(最大似然估计挖掘模型)的分析,将谣言中心性计算与传播概率距离进行融合,得到适应于不同网络场景的IRC(基于概率距离的最大似然估计)模型,分析其效果。第二,深入分析基于复杂网络中中心性度量的方法,寻找从总体上看更加稳定的提升方案DRC模型(基于复杂网络接近中心性计算模型)。第三,深入研究观察点部署场景下的模型,并试图找出一种模型TRC(基于带时间标签的挖掘模型)其效果能够不过份依赖于观察点部署情况,而是基于传播时间差与理论传播时间差之间的相似度进行源中心性评估。第四,在多源挖掘方面,研究现有的CMS(基于社区划分的多源挖掘)模型,将自主提出的传播概率距离融入到自适应聚类挖掘中,多次迭代产生稳定的感染区域,从而更好的挖掘出各种谣言源的感染范围,进而将问题转换为单源挖掘,形成新的ICMS(改进的CMS模型)模型。本文实验结果证明了以下几点:第一,本文改进的IRC模型能够更好的表达实际传播距离,比原始谣言中心性计算模型更加准确。第二,本文提出的DRC模型比ECC(基于复杂网络中偏心距离计算的中心性度量)模型无论在无图还是有向图在效果上均有较大的提高。第三,在实际应用场景中的观察点部署挖掘场景下,DRC模型存在对观察点选择过分依赖的情况,本文设计的基于时间标签的TRC模型可以很好的解决这一问题。第四,多谣言源挖掘场景下,本文提出的ICMS模型在基于自适应聚类的社区划分效果上比原先CMS模型有较大提升,从而使得在单源挖掘方法相同时,多谣言源挖掘效果有较大提升。
【关键词】:谣言源挖掘 概率距离 源中心性 传播子图 观察点部署
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O157.5
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第1章 绪论10-15
- 1.1 课题来源及研究背景和意义10
- 1.2 课题研究现状10-13
- 1.3 本课题主要研究内容13-14
- 1.4 本文的组织结构14-15
- 第2章 相关背景知识介绍15-22
- 2.1 引言15
- 2.2 复杂网络研究概述15-17
- 2.2.1 复杂网络基本概念介绍15-16
- 2.2.2 复杂网络社区划分算法介绍16-17
- 2.3 复杂网络中谣言源传播模型介绍17-19
- 2.4 复杂网络中谣言源挖掘介绍19-21
- 2.5 本章小结21-22
- 第3章 基于复杂网络的谣言源挖掘22-37
- 3.1 引言22
- 3.2 基于复杂网络中传播子图的单源挖掘22-29
- 3.2.1 基于概率距离的最大似然估计单源模型(IRC)22-27
- 3.2.2 基于复杂网络理论的中心性计算模型(DRC)27-29
- 3.3 基于复杂网络中候选观察点的单源挖掘29-33
- 3.3.1 基于观察点部署的DRC模型(SDRC)29-30
- 3.3.2 基于带时间标签的复杂网络谣言挖掘模型(TRC)30-33
- 3.4 基于概率距离的社区划分多源挖掘模型(ICMS)33-36
- 3.5 本章小结36-37
- 第4章 谣言源挖掘实验结果验证及分析37-54
- 4.1 引言37
- 4.2 系统框架37-39
- 4.3 实验数据及评价标准39-41
- 4.3.1 实验数据39-40
- 4.3.2 实验结果评价标准40-41
- 4.4 基于传播子图的挖掘模型实验结果与分析41-44
- 4.4.1 IRC模型效果评估41-43
- 4.4.2 DRC模型效果评估43-44
- 4.5 基于观察点的挖掘模型实验结果与分析44-46
- 4.6 ICMS多源挖掘模型实验结果与分析46-50
- 4.7 微博真实谣言案例实验验证与分析50-53
- 4.8 本章小结53-54
- 结论54-55
- 参考文献55-60
- 攻读硕士学位期间发表的论文及其它成果60-62
- 致谢62
【参考文献】
中国期刊全文数据库 前7条
1 张聿博;张锡哲;张斌;;基于观察点的信息源定位方法的准确率分析[J];东北大学学报(自然科学版);2015年03期
2 周东浩;韩文报;王勇军;;基于节点和信息特征的社会网络信息传播模型[J];计算机研究与发展;2015年01期
3 张聿博;张锡哲;张斌;;面向社交网络信息源定位的观察点部署方法[J];软件学报;2014年12期
4 王超;杨旭颖;徐珂;马建峰;;基于SEIR的社交网络信息传播模型[J];电子学报;2014年11期
5 陈慧娟;郑啸;陈欣;;微博网络信息传播研究综述[J];计算机应用研究;2014年02期
6 时京晶;;三种经典复杂网络社区结构划分算法研究[J];电脑与信息技术;2011年04期
7 骆志刚;丁凡;蒋晓舟;石金龙;;复杂网络社团发现算法研究新进展[J];国防科技大学学报;2011年01期
,本文编号:908205
本文链接:https://www.wllwen.com/kejilunwen/yysx/908205.html