网络虚假新闻检测系统的研究与实现

发布时间:2021-02-09 10:19
  随着互联网技术的进步,人们获取新闻的方式也随之发生改变,更倾向于通过网络平台获取新闻信息。网络新闻同传统的新闻相比有着较快的更新和传播速度,此外新闻的发布平台也更加多样化,在为人们带来便利的同时也使得新闻的真实性无法确定。虚假新闻具有较强的影响力,如果人们误信并进行传播,轻则造成群众的误解引发负面情绪,重则将会影响社会稳定。因此本文研发了网络虚假新闻检测系统,辅助新闻机构和媒体平台及时识别虚假新闻,阻止虚假新闻的传播,降低其影响力,从而达到维护社会稳定,促进社交网络健康发展的目的。本文仔细分析了国内外关于虚假新闻检测的研究现状,发现在特征选择方面,大多数研究提取的都是一些比较浅显的基于统计的特征,而忽略了新闻文本自身的特征。因此本文在原有的特征基础上,提出了基于文本内容自身的情感倾向性,虚假相似性特征、以及评论的情感类别特征,将提取的特征进行集成,作为SVM模型的输入特征训练分类器,实现对虚假新闻的识别。本系统实现的主要功能模块是新闻数据和评论数据的获取、新闻数据的检索与分析、网络新闻的虚假性检测、虚假新闻数据可视化。在本系统中,首先通过TextRank算法对文本进行主题词提取,根据主... 

【文章来源】:辽宁大学辽宁省 211工程院校

【文章页数】:84 页

【学位级别】:硕士

【部分图文】:

网络虚假新闻检测系统的研究与实现


网民规模和互联网普及率

网民,手机,社会,比例


第1章绪论2图1-2手机网民规模及其占比随着社会和科技的不断进步,网民使用手机上网的比例日益增长,这使得人们获取新闻信息的方式发生了巨大的变化,从前人们只能在报纸或者新闻报道上获取新闻信息,如今则可以通过移动终端等随时随地的获取新闻信息。同传统的新闻媒体相比,社交媒体平台上因其时效性强、内容简短、便于阅读等特点逐渐成为了当下大多数年轻人获取新闻信息的主要平台,据统计有超过80%的新闻事件最早都是源自于微博平台[2]。此外新闻的发布方式也发生了一些变化,社交媒体上,不仅仅是只有专业的新闻工作者能发布信息,普通用户也可以发表信息。这些平台在为人们提供便利的同时,也滋生了许多问题,比如有一些人为达到某种目的,蓄意编造或传播虚假新闻,以从中获取利益或引起社会恐慌,这就导致了一些虚假新闻信息的产生。虚假新闻曾经被赋予过各种各样的标签,如错误信息、谣言或者垃圾邮件等[3]。每个人可能对虚假新闻有着自己的直观定义,在不同的论文中作者可能会采用不同的角度对虚假新闻一词进行定义,在本篇论文中主要将虚假新闻定义为社交媒体上用户发布的虚假信息,即没有经过官方证实个人发布的与事实不符的新闻信息或者谣言。对于普通用户来说,由于所从事的领域不同,对于本专业领域的虚假新闻可能会迅速识别出来并选择不相信这种虚假的信息,但由于对于其他领域并不

信息人,平台


第1章绪论3了解,从而无法准确判断每一篇新闻的真实性。如果人们误信这种虚假新闻并进行传播,可能会引发一些不良的后果,轻则造成群众的误解引发负面情绪,重则将会影响社会稳定。现在已经有一些平台来曝光虚假新闻,如中国互联网联合辟谣平台以及微博社区管理中心等都会不定时的曝光一些在社交平台和网络媒体上广为传播的虚假新闻。微博作为目前用户最多的社交平台,也采取了人工识别的方法来曝光其平台上的虚假新闻,用户可以举报发布不实信息的博主,然后通过微博社区管理中心的工作人员进行人工鉴定,最终给出这篇微博是否是不实新闻的结论。但这种人工判别的方式需要举报人进行举证,且会耗费大量的时间和精力,判别效率不高,因此对于网络上的虚假新闻进行自动检测成为大势所趋。如果能够在短时间内识别出虚假新闻并加以澄清,避免虚假新闻的广泛传播,则可以维护社会稳定,促进社交网络健康发展。图1-3为微博不实信息人工鉴定平台。图1-3微博不实信息人工鉴定平台1.2研究现状近年来,许多国内外学者从不同角度对网络虚假新闻检测进行了研究。从

【参考文献】:
期刊论文
[1]一种改进的基于欧氏距离的SDRSMOTE算法[J]. 李克文,林亚林,杨耀忠.  计算机工程与科学. 2019(11)
[2]基于多部情感词典和规则集的中文微博情感分析研究[J]. 吴杰胜,陆奎.  计算机应用与软件. 2019(09)
[3]HanLP2.0[J]. 汤连杰.  软件和集成电路. 2019(08)
[4]循环神经网络研究综述[J]. 杨丽,吴雨茜,王俊丽,刘义理.  计算机应用. 2018(S2)
[5]基于Co-Training的微博垃圾评论识别方法[J]. 李志欣,兰丹媚,张灿龙,唐素勤.  计算机工程. 2018(07)
[6]基于TF-IDF和余弦相似度的文本分类方法[J]. 武永亮,赵书良,李长镜,魏娜娣,王子晏.  中文信息学报. 2017(05)
[7]文本情感分类预处理研究[J]. 杨欢.  电子技术与软件工程. 2016(10)
[8]基于词频统计的文本关键词提取方法[J]. 罗燕,赵书良,李晓超,韩玉辉,丁亚飞.  计算机应用. 2016(03)
[9]基于深层特征和集成分类器的微博谣言检测研究[J]. 毛二松,陈刚,刘欣,王波.  计算机应用研究. 2016(11)
[10]基于XPath的新闻信息抽取系统设计与实现[J]. 阮娟.  智能计算机与应用. 2015(02)

博士论文
[1]中国网络新闻可信度研究[D]. 刘琼.华中科技大学 2011

硕士论文
[1]基于K近邻的分类算法研究[D]. 桑应宾.重庆大学 2009



本文编号:3025485

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3025485.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99847***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com