在线社会网络中影响力度量和流行度预测问题研究

发布时间:2017-05-04 13:15

  本文关键词:在线社会网络中影响力度量和流行度预测问题研究,,由笔耕文化传播整理发布。


【摘要】:随着互联网技术的高速发展和Web 2.0时代的到来,互联网上涌现出各种类型的社会媒体,深刻的改变了人们获取信息和相互沟通的方式。社会媒体作为新的传播媒介,大大弱化了传统媒体在信息传播中的主导地位,使信息传播过程呈现出用户既是信息源又是信息受众的网络化传播模式。社会媒体的出现和发展大大降低了在线社会网络中信息传播的成本,使其呈现出传播速度快、覆盖范围广和社会影响力深等特点。然而已有研究指出,在线社会网络中信息的流行程度呈现幂律分布,即仅有少量的信息可以覆盖大范围的用户,而大部分信息均不能变得流行。这种现象使研究者对以下几个问题比较关注:什么样的信息能够变得流行,即能否在信息传播初期预测其流行程度;信息传播过程涉及的诸多因素中,决定信息流行程度的关键因素是什么;如何衡量网络中用户传播信息的能力并进一步识别出在信息传播过程中起到重要作用的用户等。以上问题涉及对在线社会网络中影响力度量和流行度预测等问题的研究,这是目前国内外研究的热点问题,也是本文关注的主要研究问题。本文以国家自然科学基金为依托,围绕在线社会网络上信息传播过程这一研究主题,主要针对影响力度量和流行度预测两个关键问题展开研究。本文的主要工作和创新点包括以下几个方面:1.提出了一种基于网络局部结构的节点影响力测度。为实现对大规模在线社会网络中节点影响力准确而高效的度量,本文提出了一种基于网络局部结构的局部结构化中心性(Local Structural Centrality,简称LSC)测度。区别于已有局部测度,LSC测度综合考虑了节点周围局部网络的拓扑结构信息以及最近邻节点的影响力反馈。具体的,节点周围的局部网络由节点与其最近邻和次近邻节点组成,局部网络的拓扑结构信息包括网络中节点的数量和节点间的拓扑连接。最近邻节点的影响力反馈体现在节点的影响力为其最近邻节点相对影响力的线性和。为验证LSC测度的有效性和鲁棒性,本文在不同规模的真实网络以及不同规模、不同度分布、不同社区结构的人工网络上进行实验。实验结果表明,LSC测度对节点影响力度量的性能优于度中心性、k-壳中心性、介数中心性、接近中心性和局部中心性等测度,而且其性能不受网络类型的影响。此外,实验结果表明LSC测度可以更为细致的区分节点的影响力并能够对网络中最有影响力的节点进行更好地排序。由于仅考虑了节点周围的局部网络,LSC测度具有较低的时间复杂度,可在大规模网络上直接应用。2.研究了微博平台上流行度预测问题中的有效特征。本文通过将微博平台上的流行度预测问题形式化为分类问题,研究了分类问题中的有效特征。具体的,本文研究了两种预测任务,基于消息在其发布后1小时内的转发过程预测消息流行度(PPIH)和基于消息的前k次转发预测消息流行度(PPkR)。本文将两种预测任务分别形式化为预测消息流行度取值区间的多分类任务和预测消息是否会流行的二分类任务,并采用了五种常用的分类器(朴素贝叶斯、K近邻、支持向量机、逻辑回归和Bagging决策树)。为识别分类任务中的有效特征,本文对消息转发过程中的一系列特征进行了研究分析,其中包括从底层用户网络中提取的转发网络特征和边界网络特征,以及从消息转发链中提取的时间特征。进一步,为消除用户活跃度变化对分类任务的影响,本文提出了微博时间的概念,并用其度量时间特征。通过在新浪微博数据集上的实验结果表明:在预测任务PPIH中,结合了全部特征的Bagging决策树具有最优的分类性能,而且边界网络特征比剩余两组特征更有效;在预测任务PPkR中,仅通过前10条转发消息的时间特征就可以取得较好的分类性能。进一步,实验证实,通过引入微博时间的概念,时间特征的分类性能可以得到显著提升。3.提出了一种基于增强泊松过程的微博消息流行度预测模型。该模型从建模微博消息转发过程对应时间序列的角度研究了流行度预测问题。具体的,该模型基于增强泊松过程,建模了消息流行度的增长机制,其中包括消息转发过程中的三个关键因素:(1)消息的适应力,表示消息吸引用户转发的能力;(2)幂律时间松弛方程,描述消息新颖性随时间衰减的现象;(3)指数增强方程,描述消息转发中存在的优先连接现象。进一步,为了消除用户活跃度变化对于模型预测性能的影响,本文再次引入微博时间的概念并设计时间映射过程。通过在新浪微博数据集上的实验结果表明:相比于已有的预测模型,本文提出的模型可以更有效的建模微博消息的转发过程并对消息流行度进行更准确的预测。此外,通过在模型中集成时间映射过程,可以去除用户活跃度变化的影响并显著地提高模型的预测性能。
【关键词】:在线社会网络 信息传播 影响力度量 流行度预测 增强泊松过程
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP393.09
【目录】:
  • 摘要12-14
  • ABSTRACT14-17
  • 第1章 绪论17-33
  • 1.1 研究背景17-20
  • 1.2 本文的研究内容及研究意义20-22
  • 1.3 相关研究工作22-29
  • 1.3.1 影响力度量22-26
  • 1.3.1.1 基于网络局部结构的测度22-23
  • 1.3.1.2 基于网络全局结构的测度23-25
  • 1.3.1.3 其他类型的测度及讨论25-26
  • 1.3.2 流行度预测26-29
  • 1.3.2.1 基于分类/回归的预测方法26-27
  • 1.3.2.2 基于时间序列建模的预测方法27-28
  • 1.3.2.3 其他类型的预测方法及讨论28-29
  • 1.4 本文的主要工作及创新点29-31
  • 1.5 本文的组织结构31-33
  • 第2章 相关预备知识33-50
  • 2.1 网络科学相关知识33-41
  • 2.1.1 网络基本拓扑性质33-37
  • 2.1.2 网络模型37-40
  • 2.1.2.1 BA无标度网络模型37-39
  • 2.1.2.2 LFR网络模型39-40
  • 2.1.3 经典传染病模型40-41
  • 2.2 机器学习中常用分类器41-48
  • 2.2.1 朴素贝叶斯42
  • 2.2.2 K近邻42-43
  • 2.2.3 支持向量机43-45
  • 2.2.4 逻辑回归45-46
  • 2.2.5 决策树46-48
  • 2.3 泊松过程48-49
  • 2.4 本章小结49-50
  • 第3章 基于网络局部结构的节点影响力测度50-72
  • 3.1 引言50-51
  • 3.2 中心性测度51-53
  • 3.3 局部结构化中心性测度53-55
  • 3.4 实验设置55-57
  • 3.4.1 数据集55-56
  • 3.4.2 传播模型及传播概率56-57
  • 3.4.3 评价标准57
  • 3.5 实验与分析57-71
  • 3.5.1 真实网络57-64
  • 3.5.1.1 测度性能分析57-60
  • 3.5.1.2 排序最有影响力的节点60-64
  • 3.5.2 人工网络64-68
  • 3.5.2.1 BA无标度网络64-66
  • 3.5.2.2 LFR网络66-68
  • 3.5.3 SI模型68-70
  • 3.5.4 区分节点影响力的能力70-71
  • 3.6 本章小结71-72
  • 第4章 微博平台上流行度预测问题有效特征研究72-86
  • 4.1 引言72-73
  • 4.2 问题定义73-74
  • 4.3 特征描述74-80
  • 4.3.1 结构特征74-77
  • 4.3.1.1 转发网络特征74-76
  • 4.3.1.2 边界网络特征76-77
  • 4.3.2 时间特征77-79
  • 4.3.3 讨论79-80
  • 4.4 实验设置80-81
  • 4.4.1 数据集80
  • 4.4.2 评价标准80-81
  • 4.4.3 实现细节81
  • 4.5 实验结果81-84
  • 4.5.1 PP1H任务81-82
  • 4.5.2 PPkR任务82-84
  • 4.5.3 微博时间的有效性84
  • 4.6 本章小结84-86
  • 第5章 基于增强泊松过程的微博消息流行度预测模型86-105
  • 5.1 引言86-87
  • 5.2 问题定义87-88
  • 5.3 增强泊松过程模型概述88-89
  • 5.4 微博平台上流行度预测模型89-96
  • 5.4.1 时间松弛方程89-90
  • 5.4.2 增强方程90-91
  • 5.4.3 用户活跃度分析及时间映射过程91-93
  • 5.4.4 预测模型93-96
  • 5.4.4.1 模型输入94
  • 5.4.4.2 模型建立94-95
  • 5.4.4.3 参数估计95
  • 5.4.4.4 预测95-96
  • 5.5 实验设置96-99
  • 5.5.1 数据集96-97
  • 5.5.2 比较方法97-98
  • 5.5.3 评价标准98-99
  • 5.6 实验结果99-103
  • 5.6.1 预测结果99-102
  • 5.6.2 模型参数分析102-103
  • 5.7 本章小结103-105
  • 第6章 总结与展望105-108
  • 6.1 主要工作总结105-106
  • 6.2 未来工作展望106-108
  • 参考文献108-121
  • 致谢121-122
  • 攻读学位期间发表的学术论文目录122-124
  • 攻读学位期间参与科研项目情况124-125
  • 攻读学位期间获奖情况125-126
  • 外文论文126-162
  • 学位论文评阅及答辩情化表162

【参考文献】

中国期刊全文数据库 前1条

1 胡庆成;尹煈q

本文编号:345159


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/345159.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4288e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com