基于多任务学习的假新闻检测
发布时间:2022-01-17 16:05
随着互联网的普及,越来越多的人选择在网络上阅读新闻。不同于传统新闻媒体,互联网新闻有许多新特点,如获取成本低、时效性高等特点。然而,大量包含虚假信息的新闻得以在各种社交媒体上肆意传播,其大量涌入给互联网新闻这一领域带来了严重的负面影响。因此,如何识别假新闻,并及时停止其传播,对构造一个良好的互联网氛围至关重要。假新闻检测并非易事,其甄别过程往往需要专业的背景知识。现阶段检测假新闻的主要方式是人工审核,考虑到互联网上新闻的数据量之大、传播范围之广,人工审核的方式很难解决效率低、时延性高等不可避免的问题。随着人工智能的发展,研究者们期望通过人工智能技术自动地检测假新闻。然而,互联网上传播的新闻其文本内容的长度较短,这使得传统的基于文本的假新闻检测方法难以取得满意的效果。本文研究了基于多任务学习的假新闻检测问题。互联网新闻往往会在多个社交媒体上发布与传播,这些新闻涵盖了大量不同的主题,传统的基于手工设计特征的机器学习方法很难保证设计特征集的泛化能力。考虑到在一些主题下假新闻出现的概率更大,本文挖掘了新闻的真实性和新闻的主题之间的内在关联,并提出了一个基于多任务学习的假新闻检测模型(Fake ...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
Word2Vec在三维空间的可视化1经由Word2Vec训练得到的词向量蕴含了语义信息,其直观体现为词义相近的
哈尔滨工业大学工程硕士学位论文功能主要为用户提供近年来不同真实性新闻的数量统计分析。通过选择起止时间,系统使用Echarts绘图工具动态地绘制各年被人工标注为True、Mostly-True、Half-True、Barely-True、False、Pants-Fire的新闻数量。此外,系统提供了多种图表展示方式,如区域图、折线图、柱状图、极坐标系下的柱状图等。通过对历年真假新闻的数量统计分析,用户可以直观的分析出各年份新闻的真实性分布。如图5-3展示了2009年至2019年不同真实性新闻的数量变化。图5-32009年至2019年不同真实性新闻的数量变化(2)新闻作者可视化(SpeakerVisualization):目前系统中共存储了4356名新闻作者,用户可以搜索或者按照索引选择待分析新闻作者。系统分三个层面展示新闻作者:基本信息、历史信用表现、词云。其中,新闻作者的基本信息包括作者所属政党和作者家乡;历史信用表现以饼状图的形式展示该作者所述的不同真实性新闻的数量,从该饼状图可以清晰的了解到该作者的历史信用表现,如图5-4展示了美国佛罗里达州参议员RickScott的历史信用表现。词云(WorldCloud)则展示了该新闻作者发布新闻的高频词汇。图5-4RickScott的历史信用表现-41-
RickScott的历史信用表现-41-
【参考文献】:
期刊论文
[1]基于深层特征和集成分类器的微博谣言检测研究[J]. 毛二松,陈刚,刘欣,王波. 计算机应用研究. 2016(11)
[2]微博谣言检测方法研究[J]. 程亮,邱云飞,孙鲁. 计算机应用与软件. 2013(02)
本文编号:3595028
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
Word2Vec在三维空间的可视化1经由Word2Vec训练得到的词向量蕴含了语义信息,其直观体现为词义相近的
哈尔滨工业大学工程硕士学位论文功能主要为用户提供近年来不同真实性新闻的数量统计分析。通过选择起止时间,系统使用Echarts绘图工具动态地绘制各年被人工标注为True、Mostly-True、Half-True、Barely-True、False、Pants-Fire的新闻数量。此外,系统提供了多种图表展示方式,如区域图、折线图、柱状图、极坐标系下的柱状图等。通过对历年真假新闻的数量统计分析,用户可以直观的分析出各年份新闻的真实性分布。如图5-3展示了2009年至2019年不同真实性新闻的数量变化。图5-32009年至2019年不同真实性新闻的数量变化(2)新闻作者可视化(SpeakerVisualization):目前系统中共存储了4356名新闻作者,用户可以搜索或者按照索引选择待分析新闻作者。系统分三个层面展示新闻作者:基本信息、历史信用表现、词云。其中,新闻作者的基本信息包括作者所属政党和作者家乡;历史信用表现以饼状图的形式展示该作者所述的不同真实性新闻的数量,从该饼状图可以清晰的了解到该作者的历史信用表现,如图5-4展示了美国佛罗里达州参议员RickScott的历史信用表现。词云(WorldCloud)则展示了该新闻作者发布新闻的高频词汇。图5-4RickScott的历史信用表现-41-
RickScott的历史信用表现-41-
【参考文献】:
期刊论文
[1]基于深层特征和集成分类器的微博谣言检测研究[J]. 毛二松,陈刚,刘欣,王波. 计算机应用研究. 2016(11)
[2]微博谣言检测方法研究[J]. 程亮,邱云飞,孙鲁. 计算机应用与软件. 2013(02)
本文编号:3595028
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3595028.html