基于微博的负面热点新闻早期预测分析
发布时间:2021-03-12 06:55
随着网络和通讯技术的发展,微博成为了重要的舆论场所,公众直接在微博平台上抒发情感和表达意见。微博平台传递公众心声,富含重要舆情价值的信息。而且其传播广度和速度远远超越了传统新闻媒体,会造成舆论事件影响的迅速扩散,增加事件解决的难度。所以微博平台是政府舆情监控必须重视的平台。而在政府的舆情监控系统中,负面热点新闻的早期预测尤其关键。因为负面新闻影响社会稳定,破坏性极显著,只有及时预测发现网络负面热点新闻,帮助政府部门把握住处理负面热点事件的最佳时机,才能最小化负面热点新闻带来的伤害,维护好社会的安定。但是由于负面新闻的突发性和复杂性,目前负面热点新闻早期预测这个课题还没有很好地被研究解决。故本文将通过对媒体报导事件在微博中走势的全面分析,和对关注该事件的用户的情感走势分析,判断预测该事件是否是舆情负面热点,很好地解决负面热点新闻早期预测的问题。本文主要从以下方面作出贡献:1.探讨了国内外热点新闻发现的研究现状和微博平台的情况,发现将微博平台用于负面热点发现的可行性,并创新性的提出基于微博平台的负面热点发现技术,打破以往的负面热点发现技术范畴。2.探究分析负面热点新闻特征和微博平台特征,创...
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
负面热点新闻指标关系图
第三章 负面热点新闻早期预测对应新浪微博上的用户反应信息主要是先将报导新闻标题作为关键词,利用新浪微博搜索,最后把相应的搜索结果采集下来。数据采集的过程中还注意信息的去重,主要是新闻站点新闻报导的去重。文本分析处理模块主要是针对微博文本进行中文分词和相应的词频统计,tf*idf 作为词的权重,用向量空间表示一个话题,来把话题进行归类,判断话题的深度。此外,它还涉及借助负面词出现的比例来判断新闻的破坏性。数据统计分析模块主要是统计分析出话题描述的各个指标及热点七因素的计算。预测模型就是利用本文提出的预测算法,通过简单的机器学习和人工参与,得到负面热点预测的指标,对以后的新闻进行负面热点判断。系统的一般流程就是首先新闻数据采集,然后对新闻数据进行文本分析和统计分析,得到新闻数据热点七因素和破坏性的值,最后利用预测模块进行判断预测。具体流程见下图:
图 5.1 新闻样本敏感性维度对比话题的敏感性度量该话题受到公众的持续关注度。从上图三类新闻均值线可以看出,全国热点的敏感度最高,均值达到 1.1;地方热点此致,均值为 0.61;而非热点的敏感性最低,而且差别比较大,为-0.39。这也验证了敏感度高的话题能够立即得到广大公众的关注,更容易成为热点话题。敏感性这个维度可以很好的衡量一个新闻话题热度,而且对三类新闻话题区分度也明显,对热点新闻的预测起到很大作用。但是从上图可以看出,全国热点的敏感值线和地方热点的敏感值线出现交叉,表明不是敏感值高的话题就一定是全国热点话题,也不是敏感值相对较低的话题就不能成为全国热点话题,还要考量其他维度的影响。同样,地方热点的敏感值线和非热点的敏感值线也出现交叉,表明一开始敏感值低的话题也可能发展成为地方热点话题。5.3.2 话题潜在发展力维度依照本文定义的话题潜在发展力因素计算公式,求得21个新闻样本的潜在发展力,结果如表 5.3:
【参考文献】:
期刊论文
[1]基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J]. 平亮,宗利永. 图书情报知识. 2010(06)
[2]从受众视角解读微博现象[J]. 何瑶,陈晓芝. 新闻爱好者. 2010(19)
[3]从微博的特点看危机潜伏期政府如何预警——以富士康跳楼事件为例[J]. 张兵,张金华. 新闻世界. 2010(09)
[4]大学生微博使用动机模型实证研究[J]. 李芳,曲豫宾. 福建论坛(社科教育版). 2010(08)
[5]由突发事件看微博的传播机制[J]. 陈红玉. 传媒观察. 2010(08)
[6]微博传播环境下舆论生成初探[J]. 吕航,张婷. 新闻传播. 2010(06)
[7]传播学视域中的微博研究[J]. 杨晓茹. 当代传播. 2010(02)
[8]话题发现与追踪技术研究[J]. 张晓艳,王挺. 计算机科学与探索. 2009(04)
[9]基于聚类的网络舆情热点发现及分析[J]. 王伟,许鑫. 现代图书情报技术. 2009(03)
[10]货运量影响因素分析——多元线性回归分析[J]. 宋彩平,韩飞. 现代商贸工业. 2009(06)
本文编号:3077881
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
负面热点新闻指标关系图
第三章 负面热点新闻早期预测对应新浪微博上的用户反应信息主要是先将报导新闻标题作为关键词,利用新浪微博搜索,最后把相应的搜索结果采集下来。数据采集的过程中还注意信息的去重,主要是新闻站点新闻报导的去重。文本分析处理模块主要是针对微博文本进行中文分词和相应的词频统计,tf*idf 作为词的权重,用向量空间表示一个话题,来把话题进行归类,判断话题的深度。此外,它还涉及借助负面词出现的比例来判断新闻的破坏性。数据统计分析模块主要是统计分析出话题描述的各个指标及热点七因素的计算。预测模型就是利用本文提出的预测算法,通过简单的机器学习和人工参与,得到负面热点预测的指标,对以后的新闻进行负面热点判断。系统的一般流程就是首先新闻数据采集,然后对新闻数据进行文本分析和统计分析,得到新闻数据热点七因素和破坏性的值,最后利用预测模块进行判断预测。具体流程见下图:
图 5.1 新闻样本敏感性维度对比话题的敏感性度量该话题受到公众的持续关注度。从上图三类新闻均值线可以看出,全国热点的敏感度最高,均值达到 1.1;地方热点此致,均值为 0.61;而非热点的敏感性最低,而且差别比较大,为-0.39。这也验证了敏感度高的话题能够立即得到广大公众的关注,更容易成为热点话题。敏感性这个维度可以很好的衡量一个新闻话题热度,而且对三类新闻话题区分度也明显,对热点新闻的预测起到很大作用。但是从上图可以看出,全国热点的敏感值线和地方热点的敏感值线出现交叉,表明不是敏感值高的话题就一定是全国热点话题,也不是敏感值相对较低的话题就不能成为全国热点话题,还要考量其他维度的影响。同样,地方热点的敏感值线和非热点的敏感值线也出现交叉,表明一开始敏感值低的话题也可能发展成为地方热点话题。5.3.2 话题潜在发展力维度依照本文定义的话题潜在发展力因素计算公式,求得21个新闻样本的潜在发展力,结果如表 5.3:
【参考文献】:
期刊论文
[1]基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J]. 平亮,宗利永. 图书情报知识. 2010(06)
[2]从受众视角解读微博现象[J]. 何瑶,陈晓芝. 新闻爱好者. 2010(19)
[3]从微博的特点看危机潜伏期政府如何预警——以富士康跳楼事件为例[J]. 张兵,张金华. 新闻世界. 2010(09)
[4]大学生微博使用动机模型实证研究[J]. 李芳,曲豫宾. 福建论坛(社科教育版). 2010(08)
[5]由突发事件看微博的传播机制[J]. 陈红玉. 传媒观察. 2010(08)
[6]微博传播环境下舆论生成初探[J]. 吕航,张婷. 新闻传播. 2010(06)
[7]传播学视域中的微博研究[J]. 杨晓茹. 当代传播. 2010(02)
[8]话题发现与追踪技术研究[J]. 张晓艳,王挺. 计算机科学与探索. 2009(04)
[9]基于聚类的网络舆情热点发现及分析[J]. 王伟,许鑫. 现代图书情报技术. 2009(03)
[10]货运量影响因素分析——多元线性回归分析[J]. 宋彩平,韩飞. 现代商贸工业. 2009(06)
本文编号:3077881
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3077881.html