结合影响力分析的微博舆情溯源研究
发布时间:2017-12-08 15:03
本文关键词:结合影响力分析的微博舆情溯源研究
【摘要】:摘要:舆情溯源的主要目的是找到舆论传播的源头和途径,为舆论传播的深入研究夯实基础。由于信息的产生和传递方式在不同的网络平台并不相同,舆情溯源的手段也不尽相同。本文选择了新浪微博这一社交网络作为研究对象,是由于其本身具有较高的流行性并且在舆情传播方面也有较强的代表性。 本文首先对微博进行了整体分析,指出其短文本、话题驳杂等特性。随后针对这些特性及舆情溯源的需求,提出了一个以同话题聚类为基础,结合影响力分析的舆情溯源解决方案。 在对微博的相似度进行计算时,为了最大限度的挖掘微博内容间的联系,文章利用以《知网》为基础的词语相似度计算替代了适用于长文本的简单的词语统计的方式(即文本空间)。同时,针对原有的词语相似度算法忽略了义原含义的具体化程度不同的问题,提出了一种结合深度系数的词语相似度算法。这些工作令微博间主题的相似度估算更加精确,使微博的同话题聚类的正确率得到了提升。 为了对目标舆情问题的主要发展轨迹进行追踪,本文利用了影响力分析这一方法筛选出对传播起到了重要作用的微博,这些微博即代表了事件传播的主要途径。文章首先对影响力的本质进行了深入剖析,随后结合微博这一具体平台建立了一种以直接影响力和潜意识影响力为基础的影响力模型。这一模型综合考虑了微博的各项属性,包括转发数、评论数、微博用户的个体特征等等,较为科学合理的评估了微博的影响力。 本文利用JAVA语言对舆情溯源的各个部分分别进行了仿真,仿真结果表明文中提出的算法在单个环节中均取得了较为良好的效果。同时,文章的最后综合这些算法进行了完整的舆情溯源,溯源的结果也较为理想。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【参考文献】
中国期刊全文数据库 前10条
1 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期
2 闫瑞;曹先彬;李凯;;面向短文本的动态组合分类算法[J];电子学报;2009年05期
3 尤f ,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期
4 曹丹阳;杨炳儒;李广原;刘英华;;一种基于CF树的k-medoids聚类算法[J];计算机应用研究;2011年09期
5 张晓艳;王挺;;话题发现与追踪技术研究[J];计算机科学与探索;2009年04期
6 刘毅;;略论网络舆情的概念、特点、表达与传播[J];理论界;2007年01期
7 姜胜洪;;网络舆情热点的形成与发展、现状及舆论引导[J];理论月刊;2008年04期
8 黄永光;刘挺;车万翔;胡晓光;;面向变异短文本的快速聚类算法[J];中文信息学报;2007年02期
9 董振东;董强;郝长伶;;知网的理论发现[J];中文信息学报;2007年04期
10 江敏;肖诗斌;王弘蔚;施水才;;一种改进的基于《知网》的词语语义相似度计算[J];中文信息学报;2008年05期
,本文编号:1266792
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1266792.html