当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的微博新闻谣言检测研究与实现

发布时间:2020-06-16 08:19
【摘要】:随着互联网技术的发展和应用的普及,互联网中的信息量正以指数级别的速度飞速地增长,已经成为了一个巨大的信息库。也正因如此大量不可靠的信息可以快速地在人群中传播。而社交媒体上的谣言泛滥可能会导致社会混乱,进而影响人们正常的生活秩序。特别是在面临突发公共事件时,广泛传播的谣言可能会具有极大的破坏性。谣言检测是自然语言处理中文本分类的子任务。谣言检测的主要目的是识别没有丝毫结构规则可言的新闻文本,判断其是否为假新闻(谣言)。在当今社会,微博已经成为人们日常生活中不可分割的一部分,因此本论文选用微博作为实现谣言检测的平台。本课题的研究目的是从海量微博新闻文本信息中,挖掘其中的蕴含的特征,并提出一种新的谣言检测的方法,以微博上的新闻文本和用户评论为数据,对其进行建模,找出分类的关键特征,并以深度学习模型进行分类预测,判断其是否为假新闻(谣言)。所以,本文的主要工作如下所示:1)研究基于用户对于微博新闻观点的谣言检测算法。在社交媒体中,用户可以自由直接地表达对于新闻的看法,用户对于该微博新闻的态度,可以作为一种很重要的特征。因此,本算法同时将评论分为两种大小不同的粒度:词语和评论句子,并结合两种粒度提出了一种谣言检测算法。之后在数据集上与经典谣言检测算法进行了对比试验,验证了算法的有效性。2)研究基于微博新闻文本的情感分类算法。谣言往往带有很强的煽动性,希望会得到广泛的关注与传播,因此大部分会带有比较强烈的感情色彩在其中。本文基于经典的文本分类算法,结合情感词典,提出了一种新的文本情感分类算法,使算法模型对于情感词可以给予更多的关照,并通过实验和经典方法进行对比,验证了算法的有效性。3)结合上述两种结果的算法。本文主要综合考虑了情感倾向和用户态度这两个维度的特征对谣言检测可能产生的影响,因此,通过预训练的方式,将上述两种模型产生的结果进行结合。4)原型系统的设计与研究。本论文以微博为平台,用以实现自己的原型系统。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP181
【图文】:

组织结构图,算法结构,论文,组织结构


因此,本文从用户对于微博新闻的观点,和微博新闻文本本身两个方面进行逡逑研宄,之后通过整合两个方面的结果以提升整体的分类的准确度和系统性能。主逡逑要结构框图如下图1-2所示。逡逑新闻本身文逦|微博新闻评逡逑本信息逦论信息逡逑逦]邋[邋邋逦]邋[邋逡逑文本情感信逦|评论建模分逡逑息逦析逡逑逦I邋[逦邋邋}逦[逦逡逑文本特征向逦|新闻评论特逡逑量逦征向量逡逑结合文本特逡逑征向量和评逡逑论特征向| 逡逑图1-2本文算法结构图逡逑1.4论文组织结构逡逑本论文主要阐述了基于微博新闻的谣言检测算法的研究与原型系统的实现,逡逑共分为七个部分,组织结构如下:逡逑第一章:介绍了本论文的研究背景和研究内容。并简要说明了研究的意义和逡逑国内外研究的现状。逡逑第二章:介绍了本文所使用的相关技术。逡逑第三章:针对用户评论这一特征,提出了基于用户观点的谣言检测模型算法,逡逑并通过真实的数据集,和经典谣言检测算法进行对比试验,验证了该方法的有效逡逑性。逡逑第四章:针对微博新闻文本的情感特征进行研究,提出了一种基于情感词典逡逑的情感分类算法,并通过数据集上的对比试验,验证了该方法能很好的捕获文本逡逑的情感特征。逡逑6逡逑

单元结构,输出门


图2-1邋LSTM单元结构逡逑中,A表示遗忘门,G表示输入门,ct-i表示前一时刻单元状态、q表示当逡逑状态(产生自循环),0t表示输出门,\表示当前单元的输出,h-l表示前逡逑单元的输出。因此,计算公式如公式2-1至公式2-6所示。逡逑h邋—逦+逦^i)逦(2邋—邋1)逡逑ot邋=邋a(xtW0邋+邋h^Uo邋+邋b0)逦(2邋—邋2)逡逑ft邋=邋a(xtWf邋+邋ht^Uf邋+邋bf)逦(2-3)逡逑c[邋=邋tanh(xtM/c邋+逦+邋^c)逦(2邋—邋4)逡逑ct邋=邋ft'邋ct-i邋h邋'邋ct逦(2邋—邋5)逡逑ht邋—邋ot邋?邋tanh(ct)逦(2邋—邋6)逡逑RU基础单元逡逑RU即Gated邋Recurrent邋Unit,实际上属于LSTM的一个变体,既保持,。,LSTM

【相似文献】

相关期刊论文 前10条

1 王海;刘瑞锋;;新闻文本英汉翻译中褒奖性与贬损性词语的语用特征[J];电视指南;2017年17期

2 张书宁;;新闻文本英译的策略性研究[J];北方文学;2017年18期

3 赵建伟;;网媒语境对新闻文本客观性的削弱[J];青年记者;2014年29期

4 崔军艺;郑培华;;浅谈网络新闻文本的传播价值[J];科技资讯;2012年33期

5 吕怡然;;真实:新闻文本的第一价值[J];青年记者;2011年25期

6 蒲晓彬;;论新闻文本精神活动流程中的事料[J];黄河科技大学学报;2011年05期

7 谭志红;李铁锤;;新闻文本的特性分析[J];传媒观察;2009年08期

8 华进;王潇涓;;电视新闻文本的叙事学解读[J];现代视听;2009年08期

9 范敬英;;网络新闻文本符号互文分析——以视频新闻为例[J];新学术;2007年04期

10 周洪林;;中西新闻文本风格比较[J];新闻界;2006年01期

相关会议论文 前4条

1 贺春禄;;报纸科技新闻文本的受众解读[A];中国科技新闻学会第九次学术年会论文集[C];2007年

2 陶建杰;;台湾主流报纸对“嫦娥一号”的报道研究——以新闻文本框架建构为视角[A];中国传媒大学第二届全国新闻学与传播学博士生学术研讨会论文集[C];2008年

3 丁和根;;论新闻报导的话语格局——兼评梵·迪克的新闻话语分析[A];全国语言与符号学研究会第五届研讨会论文摘要集[C];2002年

4 杨保军;;关于新闻本体的几个基本问题[A];新闻学论集(第22辑)[C];2009年

相关重要报纸文章 前2条

1 董天策 暨南大学新闻学院教授;多研读新闻文本[N];中华新闻报;2005年

2 曾峰 贵阳晚报;新闻也可“片面”而行[N];经济信息时报;2010年

相关博士学位论文 前3条

1 孙德宏;新闻的审美传播研究[D];东北师范大学;2010年

2 孙发友;新闻文本显性状态及其潜在张力[D];华中科技大学;2007年

3 华进;云之话语,钟之逻辑:叙事学视域下的网络新闻研究[D];华中科技大学;2013年

相关硕士学位论文 前10条

1 李菁雯;基于深度学习的新闻文本分类系统研究与实现[D];北京邮电大学;2019年

2 郭增荣;基于深度学习的微博新闻谣言检测研究与实现[D];北京邮电大学;2019年

3 蒙梅;面向网络教育新闻文本的区域分类方法研究[D];西安理工大学;2019年

4 席洁;新型新闻文本:“新闻+跟帖”的互文结构关系与舆论引导[D];烟台大学;2018年

5 王婷婷;面向新闻文本的话题发现研究[D];山西大学;2018年

6 徐蔚;基于深度学习的中文新闻文本分类的研究[D];中南民族大学;2018年

7 伏恺;Web新闻文本信息抽取与可视化研究[D];山东财经大学;2017年

8 马晨峰;混合深度学习模型在新闻文本分类中的应用[D];山东大学;2018年

9 陈杨;基于维基百科语料的新闻文本词汇链构建技术研究[D];昆明理工大学;2017年

10 王鹏;符号学视域下网络新闻文本阐意对舆论影响研究[D];渤海大学;2017年



本文编号:2715791

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2715791.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1c136***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com