基于集成学习的微博谣言识别与危害性评估
发布时间:2021-08-04 20:02
在网络信息日益增长的时代背景下,关于网络谣言的监管治理手段及立法也逐渐成为各学科领域研究的焦点之一。明确网络谣言的相关定义,分析研究网络谣言的特点,对更有效地甄别出网络信息中的谣言有着重要作用。对网络谣言的危害性进行等级划分评估,也给网络空间的治理提供了一定的技术支撑。本文主要以微博平台作为研究对象,在总汇分析了现有网络谣言相关研究的不足后,针对微博谣言的识别检测与危害评估的方法展开了研究分析。主要内容包括:第一,针对当前研究中缺少关于网络谣言的明确定义的问题,结合传播学中的5W模式给出了网络谣言与微博谣言的定义,并对微博谣言的定义进行了形式化的描述。结合定义,构造并筛选出了适用于微博谣言识别的特征集,提出了一种基于Stacking集成学习的微博谣言识别模型。实验结果表明,该微博谣言识别方法能够有效地进行谣言识别,且在实际应用中的效果最好。第二,针对当前网络谣言的相关评估主要是定性研究分析,较少进行定量分析,因而难以实现评估自动化的问题,在分析研究了前人所构建的舆情危机预警等级指标体系的基础上,结合传播学给出了网络谣言危害性的评估指标体系,并采用模糊层次分析法对各个指标进行了权重分配。...
【文章来源】:重庆邮电大学重庆市
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
常用特征总汇S.Zamani等人[55]就是利用基于用户特征和推特内容的特征,对推特上波斯社区里的信息进行谣言检测
重庆邮电大学硕士学位论文第4章微博谣言的危害性评估方法研究49由图4.5可以看到,各算法的表现差异较大,BP神经网络算法的效果整体上看要最差,决策树与随机森林算法的评估结果较为接近。整体上看,各算法在不同事件中的表现差别不大,其中随机森林(RF)、决策树(DT)和梯度提升决策树(GBDT)能较好地进行危害等级的评估划分。因此,上述实验结果能在一定程度上体现出本文所提出的微博谣言危害评估方法具有一定的可用性。5.谣言危害等级演化分析与建议为了更好地展示微博谣言的危害等级演化情况,分别将三个事件中的谣言信息所带来的危害性进行了可视化的展示,并与知微事见①中的相关事件传播趋势图进行了关联,如图4.6、图4.7和图4.8所示。图4.6“杨医生”事件谣言危害等级可视化展示由图4.6中的事件传播趋势可以看到,事件在发展初期受到了广大网民的关注,而随着时间的推移,事件相关搜索热度逐渐下降,慢慢淡出公众视野。同时,该事件中的谣言危害等级逐渐上升,在第四天的时候到达峰值后开始回落。整体上看,搜索热度与谣言危害等级一定程度上呈负相关关系,且谣言危害等级到达峰值的时间点与搜索热度并不重合。事件的搜索热度虽已到达峰值开始回落,事件相关的谣言所带来的危害还在慢慢发酵、渗透民众生活。由此可以说明,仅通过搜索热度或关注度的变化判断事件所带来的负面影响是不够准确的,且对于网络谣言的相关防治也不能因公众关注热度的下降而松懈。①https://ef.zhiweidata.com/
重庆邮电大学硕士学位论文第4章微博谣言的危害性评估方法研究50图4.7“新冠肺炎”事件谣言危害等级可视化展示由图4.7可以看到,“新冠肺炎”事件的周期较长,其搜索热度在前期上升比较明显,后面随着网民参与程度下降,搜索热度也逐渐下降并趋于平稳。整个事件过程中,谣言危害等级出现过两次峰值,整体的等级危害程度也比“杨医生”事件更高。在事件发生前期,谣言危害等级随着搜索热度的上升有所上升,但随后二者呈反比关系。当搜索热度趋于平稳后,谣言危害等级整体上随着搜索热度的起伏而变化。“新冠肺炎”事件的结果表明,对于容易产生谣言的民生话题来说,当事件整体热度开始下降后,网民讨论与关注的焦点也更容易集中在谣言信息上。图4.8“社区火灾”事件谣言危害等级可视化展示从图4.8可以看出,在“社区火灾”事件发生前期,网民的关注度上升较快但持续一天就开始回落,而谣言危害等级变化较缓,到第四天才出现峰值。相比于搜索指数,谣言危害等级的变化情况较为滞后。从整体上看,该事件的谣言危害
【参考文献】:
期刊论文
[1]基于用户特征分析的微博谣言早期检测研究[J]. 尹鹏博,潘伟民,彭成,张海军. 情报杂志. 2020(07)
[2]突发事件网络谣言危机预警及模拟仿真研究[J]. 张鹏,兰月新,李昊青,周颖. 现代情报. 2019(12)
[3]基于集成学习的文本情感分类方法[J]. 段吉东,刘双荣,马坤,孙润元. 济南大学学报(自然科学版). 2019(06)
[4]基于集成学习的情感模糊计算分类方法[J]. 刘磊,李学勇,黄永峰. 计算机工程与设计. 2018(07)
[5]基于系统动力学的突发事件网络谣言治理研究[J]. 殷飞,张鹏,兰月新,夏一雪,张琦,李增. 情报科学. 2018(04)
[6]当前网络谣言的成因、性质以及处罚的合理性——基于65个治安处罚案例[J]. 白净,程子姣. 新闻爱好者. 2018(02)
[7]改进的组合优化决策树谣言判别方法研究[J]. 罗嗣卿,王佳玉,李冰珂. 计算机仿真. 2018(02)
[8]基于梯度提升决策树的微博虚假消息检测[J]. 段大高,盖新新,韩忠明,刘冰心. 计算机应用. 2018(02)
[9]基于语义共现匹配的在线食品安全谣言相关文档识别方法研究[J]. 陈燕方,周晓英,张璐. 情报理论与实践. 2018(06)
[10]突发事件网络谣言的蔓延机理及治理策略研究[J]. 张玉亮,贾传玲. 情报理论与实践. 2018(05)
本文编号:3322320
【文章来源】:重庆邮电大学重庆市
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
常用特征总汇S.Zamani等人[55]就是利用基于用户特征和推特内容的特征,对推特上波斯社区里的信息进行谣言检测
重庆邮电大学硕士学位论文第4章微博谣言的危害性评估方法研究49由图4.5可以看到,各算法的表现差异较大,BP神经网络算法的效果整体上看要最差,决策树与随机森林算法的评估结果较为接近。整体上看,各算法在不同事件中的表现差别不大,其中随机森林(RF)、决策树(DT)和梯度提升决策树(GBDT)能较好地进行危害等级的评估划分。因此,上述实验结果能在一定程度上体现出本文所提出的微博谣言危害评估方法具有一定的可用性。5.谣言危害等级演化分析与建议为了更好地展示微博谣言的危害等级演化情况,分别将三个事件中的谣言信息所带来的危害性进行了可视化的展示,并与知微事见①中的相关事件传播趋势图进行了关联,如图4.6、图4.7和图4.8所示。图4.6“杨医生”事件谣言危害等级可视化展示由图4.6中的事件传播趋势可以看到,事件在发展初期受到了广大网民的关注,而随着时间的推移,事件相关搜索热度逐渐下降,慢慢淡出公众视野。同时,该事件中的谣言危害等级逐渐上升,在第四天的时候到达峰值后开始回落。整体上看,搜索热度与谣言危害等级一定程度上呈负相关关系,且谣言危害等级到达峰值的时间点与搜索热度并不重合。事件的搜索热度虽已到达峰值开始回落,事件相关的谣言所带来的危害还在慢慢发酵、渗透民众生活。由此可以说明,仅通过搜索热度或关注度的变化判断事件所带来的负面影响是不够准确的,且对于网络谣言的相关防治也不能因公众关注热度的下降而松懈。①https://ef.zhiweidata.com/
重庆邮电大学硕士学位论文第4章微博谣言的危害性评估方法研究50图4.7“新冠肺炎”事件谣言危害等级可视化展示由图4.7可以看到,“新冠肺炎”事件的周期较长,其搜索热度在前期上升比较明显,后面随着网民参与程度下降,搜索热度也逐渐下降并趋于平稳。整个事件过程中,谣言危害等级出现过两次峰值,整体的等级危害程度也比“杨医生”事件更高。在事件发生前期,谣言危害等级随着搜索热度的上升有所上升,但随后二者呈反比关系。当搜索热度趋于平稳后,谣言危害等级整体上随着搜索热度的起伏而变化。“新冠肺炎”事件的结果表明,对于容易产生谣言的民生话题来说,当事件整体热度开始下降后,网民讨论与关注的焦点也更容易集中在谣言信息上。图4.8“社区火灾”事件谣言危害等级可视化展示从图4.8可以看出,在“社区火灾”事件发生前期,网民的关注度上升较快但持续一天就开始回落,而谣言危害等级变化较缓,到第四天才出现峰值。相比于搜索指数,谣言危害等级的变化情况较为滞后。从整体上看,该事件的谣言危害
【参考文献】:
期刊论文
[1]基于用户特征分析的微博谣言早期检测研究[J]. 尹鹏博,潘伟民,彭成,张海军. 情报杂志. 2020(07)
[2]突发事件网络谣言危机预警及模拟仿真研究[J]. 张鹏,兰月新,李昊青,周颖. 现代情报. 2019(12)
[3]基于集成学习的文本情感分类方法[J]. 段吉东,刘双荣,马坤,孙润元. 济南大学学报(自然科学版). 2019(06)
[4]基于集成学习的情感模糊计算分类方法[J]. 刘磊,李学勇,黄永峰. 计算机工程与设计. 2018(07)
[5]基于系统动力学的突发事件网络谣言治理研究[J]. 殷飞,张鹏,兰月新,夏一雪,张琦,李增. 情报科学. 2018(04)
[6]当前网络谣言的成因、性质以及处罚的合理性——基于65个治安处罚案例[J]. 白净,程子姣. 新闻爱好者. 2018(02)
[7]改进的组合优化决策树谣言判别方法研究[J]. 罗嗣卿,王佳玉,李冰珂. 计算机仿真. 2018(02)
[8]基于梯度提升决策树的微博虚假消息检测[J]. 段大高,盖新新,韩忠明,刘冰心. 计算机应用. 2018(02)
[9]基于语义共现匹配的在线食品安全谣言相关文档识别方法研究[J]. 陈燕方,周晓英,张璐. 情报理论与实践. 2018(06)
[10]突发事件网络谣言的蔓延机理及治理策略研究[J]. 张玉亮,贾传玲. 情报理论与实践. 2018(05)
本文编号:3322320
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3322320.html