社交网络热点话题传播分析和预测
发布时间:2022-01-23 06:34
在线社交网络已成为信息传播的主要渠道和载体。近年来我国网络事件层出不穷,网络舆论呈现井喷态势。在这一背景下,对热点话题传播进行分析和预测,不仅要从宏观上掌握热点话题流行度的演化态势,更耑要追踪掌握传播中群体的观点变化,并对信息源头进行精确定位和快速控制。研究社交网络热点话题传播分析和预测相关技术有助于加深对社交用户行为的认识、对社交现象的理解,对于国家安全和社会稳定也具有重要的意义。本文围绕着社交网络中“热点话题检测和跟踪”、“热点话题流行度”和“热点话题溯源”这三个核心问题,以微博为主要研究场景,从四个方面展开研究,分别是面向大规模短文本流的热点话题动态检测和跟踪、基于深度学习的热点话题流行度演化分析和预测、基于传播关系的热点话题传播分析和溯源以及社交网络热点话题传播分析和预测系统。主要工作和成果总结如下:(1)针对传统话题检测与跟踪方法在大规模短文本流中准确率不高、性能不理想的问题,本文提出了一种面向大规模短文本流的热点话题动态检测和跟踪方法。通过对热点话题数据集的实证分析,探究了热点话题相关特点和规律,实现了突发事件的时空间异常检测和相关热点话题的动态检测和跟踪。最后将系统部署在...
【文章来源】:北京科技大学北京市 211工程院校 教育部直属院校
【文章页数】:128 页
【学位级别】:博士
【部分图文】:
图2-2流行度演化模式分类PA??-23-??
经典方法是Szabo和Huberman提出的SH模型[25],他们发现如果对信??息的流行度做对数处理,早期流行度和晚期流行度会呈现出很强的线性关联??性,如图2-4所示;而且随机波动可以表现为加性噪声的形式,利用这种强??关联性,他们建立了线性回归模型,并且以Digg网站上的帖子和YouTube??网站上的视频作为研究对象进行了模型验证。Bao等人考虑了网络结构特性??对流行度的影响,对SH模型进行了改进[26]。用SH模型做预测,对于那些??受到短暂关注的网络信息会预测得比较准确,而对于长时间流行的网络信息??会有很大的误差[25]。SH模型在预测那些具有不同流行度模式的网络信息也??会不准确,为了克服这个缺点,Pinto等人将SH模型扩展成多元回归模型,??以多个历史时间点的流行度作为自变量,并且考虑了流行度模式相似性的特??征[|37]。该模型对不同历史时间点的流行度分配了不同的权重,这些权重可??以通过最小化样本集的MRSE?(Mean?Relative?Squared?Error)训练出来。相??似性则度量了待预测网络信息与样本集的相似程度。??Kong等人通过机器学习算法对Twitter的Hashtag进行了学习[n8]。他们??提出了两个基本任务:该Hashtag是否会在不久的未来流行起来;如果流行??-27-??
3.1问题描述??本节对Yang和Leskovec收集的Twitter数据集tweet7丨241进行分析。如??图3-1所示,横轴表示设定的流行度值,纵轴表示Hashtag在其生命周期内??获得的总流行度大于相应横轴流行度值的Hashtag总数,可以看出,大多数??Hashtag在其生命周期内获得的总流行度很小,只有少数Hashtag可以获得??大量的流行度。???—?——‘….........??????^??L:??14?\??2'。丨?、*.%??i?*??I?8?????????????——??—+、.一*^-.''-.^_*—-???10*?10*?10*?1?4?10^?10*?1〇???Popularity??图3-1?tweet7数据集中流行度分布??-33?-??
【参考文献】:
期刊论文
[1]在线社交网络影响力分析[J]. 吴信东,李毅,李磊. 计算机学报. 2014(04)
博士论文
[1]社交网络信息传播关键技术研究[D]. 苏援.北京邮电大学 2018
[2]面向社交网络的信息传播关键技术研究[D]. 朱湘.国防科学技术大学 2017
[3]面向社交网络的话题传播关键技术研究[D]. 汪祥.国防科学技术大学 2015
[4]面向热点新闻话题的文本处理技术研究[D]. 方莹.北京理工大学 2015
[5]面向在线社交网络舆情的信息传播分析关键技术研究[D]. 梁政.国防科学技术大学 2014
硕士论文
[1]概率图模型在话题检测和信息传播中的应用研究[D]. 丁茜.北京邮电大学 2017
[2]互联网中事件检测与跟踪系统设计与实现[D]. 于兆鹏.北京交通大学 2017
本文编号:3603798
【文章来源】:北京科技大学北京市 211工程院校 教育部直属院校
【文章页数】:128 页
【学位级别】:博士
【部分图文】:
图2-2流行度演化模式分类PA??-23-??
经典方法是Szabo和Huberman提出的SH模型[25],他们发现如果对信??息的流行度做对数处理,早期流行度和晚期流行度会呈现出很强的线性关联??性,如图2-4所示;而且随机波动可以表现为加性噪声的形式,利用这种强??关联性,他们建立了线性回归模型,并且以Digg网站上的帖子和YouTube??网站上的视频作为研究对象进行了模型验证。Bao等人考虑了网络结构特性??对流行度的影响,对SH模型进行了改进[26]。用SH模型做预测,对于那些??受到短暂关注的网络信息会预测得比较准确,而对于长时间流行的网络信息??会有很大的误差[25]。SH模型在预测那些具有不同流行度模式的网络信息也??会不准确,为了克服这个缺点,Pinto等人将SH模型扩展成多元回归模型,??以多个历史时间点的流行度作为自变量,并且考虑了流行度模式相似性的特??征[|37]。该模型对不同历史时间点的流行度分配了不同的权重,这些权重可??以通过最小化样本集的MRSE?(Mean?Relative?Squared?Error)训练出来。相??似性则度量了待预测网络信息与样本集的相似程度。??Kong等人通过机器学习算法对Twitter的Hashtag进行了学习[n8]。他们??提出了两个基本任务:该Hashtag是否会在不久的未来流行起来;如果流行??-27-??
3.1问题描述??本节对Yang和Leskovec收集的Twitter数据集tweet7丨241进行分析。如??图3-1所示,横轴表示设定的流行度值,纵轴表示Hashtag在其生命周期内??获得的总流行度大于相应横轴流行度值的Hashtag总数,可以看出,大多数??Hashtag在其生命周期内获得的总流行度很小,只有少数Hashtag可以获得??大量的流行度。???—?——‘….........??????^??L:??14?\??2'。丨?、*.%??i?*??I?8?????????????——??—+、.一*^-.''-.^_*—-???10*?10*?10*?1?4?10^?10*?1〇???Popularity??图3-1?tweet7数据集中流行度分布??-33?-??
【参考文献】:
期刊论文
[1]在线社交网络影响力分析[J]. 吴信东,李毅,李磊. 计算机学报. 2014(04)
博士论文
[1]社交网络信息传播关键技术研究[D]. 苏援.北京邮电大学 2018
[2]面向社交网络的信息传播关键技术研究[D]. 朱湘.国防科学技术大学 2017
[3]面向社交网络的话题传播关键技术研究[D]. 汪祥.国防科学技术大学 2015
[4]面向热点新闻话题的文本处理技术研究[D]. 方莹.北京理工大学 2015
[5]面向在线社交网络舆情的信息传播分析关键技术研究[D]. 梁政.国防科学技术大学 2014
硕士论文
[1]概率图模型在话题检测和信息传播中的应用研究[D]. 丁茜.北京邮电大学 2017
[2]互联网中事件检测与跟踪系统设计与实现[D]. 于兆鹏.北京交通大学 2017
本文编号:3603798
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3603798.html