当前位置:主页 > 管理论文 > 移动网络论文 >

微博虚假信息鉴别技术验证平台的设计与实现

发布时间:2020-12-22 05:48
  微博的出现和发展极大的改变了传统的信息传播方式,人们无需等待传统媒体的报道就可以便捷的获取最新的资讯,从而使得信息传播速度大大提升。然而在微博为人们生活带来更丰富更快捷的信息获取体验的同时,由于微博中虚假信息的制造成本低,鉴别虚假信息往往会耗费很大的人力和时间成本,因此可以说虚假信息是制约微博发展的最重要的因素之一。针对上述问题,本文设计并实现了微博虚假信息鉴别技术验证平台。该平台既提供基于Web的图形界面,也提供开放接口,允许用户将短文本提交至平台进行鉴别;而该平台可以接入多种虚假信息鉴别算法,对用户输入的短文本进行鉴别,给出其可能是虚假信息的概率;同时该平台还支持算法有效性监测功能,将平台支持的各种算法的鉴别准确率、漏报率和误报率展示给用户。本文首先介绍了微博虚假信息鉴别技术验证平台的研究背景;调研了虚假信息鉴别算法,然后分析了微博虚假信息鉴别技术验证平台的需求;接着提出了平台架构设计以及平台中各模块的详细设计,并予以实现和测试。一系列测试证明了系统的有效性。 

【文章来源】: 李少愚 北京邮电大学

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

微博虚假信息鉴别技术验证平台的设计与实现


图3-1微信谣言辟谣助手??因此,为使微博虚假信息鉴别技术验证平台能够面向用户的主动检测,此鉴??别系统应至少覆盖短文本非关键词输入、可靠的算法支持与算法有效性监测三个??

分析结果图,鉴别技术,虚假信息,验证平台


?■???????KM??图3-1微信谣言辟谣助手??因此,为使微博虚假信息鉴别技术验证平台能够面向用户的主动检测,此鉴??别系统应至少覆盖短文本非关键词输入、可靠的算法支持与算法有效性监测三个??方面。总体需求关系如图3-2所示。??.?时'键祕龜錄沒.??■B^llj?二二蒙,漘??图3-2微博虚假信息鉴别技术验证平台需求关系图??>信息库资源:对于持续更新算法模型保证算法能够提供可靠地分析结果,同??时为算法有效性监测保留历史信息记录,验证平台需建立信息库资源为各模块功??能提供底层数据支持。??>信息鉴别:对于短文本非关键词输入主要涉及对于短文本的文本特征表示模??型的有效性,使待检测文本可以作为整体转化成向量输入算法模块进行分析,相??较于通过关键词匹配相关性文本更具有说服力。在此功能中不仅要有面向用户交??互友好的图形化界面,同时还支持整合平台现有资源为第三方平台开发者/用户??提供友好的RESTfol?API接口,包括信息库资源调用、多算法分析文本以及对应??算法的近期有效性监测。??>多算法支持:可靠的算法支持主要是指在现有的虚假信息鉴别技术基础之上

验证平台,谣言,虚假信息,鉴别技术


本章的最后对数据库表结构设计进行介绍。??4.1总体架构设计??本文设计并实现的验证平台的总体架构设计如图4-1所示,自底向上包括了??模型层、控制层、接口层和应用层这四个层次。每层功能实现相对独立,下层为??上层提供服务,上层调用下层提供的接口。以下将对各层完成的功能做简要介绍。??应用层??壤口层??控制层??…??图4-1微博虚假信息鉴别技术验证平台总体架构设计??(1)模型层??为整个验证平台即微博虚假信息鉴别技术验证平台提供了谣言库、非谣言库??以及训练完毕的模型,通过机器学习和深度学习的相关技术为整个系统提供底层??支持。本层中的分析模型将作为系统的核心,因此需要保证底层代码的高可用性,??易维护和拓展性。具体包括以下几个模块。??>算法接入模块:算法接入模块主要负责为支撑验证平台系统核心业务的算法??模型提供良好的数据输入。主要依据中文短文本分词技术,为用户提供进一步的??虚假信息鉴别服务的技术支持。??>信息库模块:拟从新浪社区管理中心采集已经被官方认定的虚假信息样本??19??

【参考文献】:
期刊论文
[1]基于分位数概要的KNN算法研究[J]. 王丹.  无线互联科技. 2015(20)
[2]基于改进语义距离的网络评论聚类研究[J]. 杨震,王来涛,赖英旭.  软件学报. 2014(12)
[3]基于语义理解的文本相似度算法[J]. 金博,史彦军,滕弘飞.  大连理工大学学报. 2005(02)
[4]知网在词语相似度计算方面的应用[J]. 易丽萍,竹勇,雷小春.  信息技术与信息化. 2005(01)

博士论文
[1]文本语义表示及多层分类关键技术研究[D]. 宋胜利.西安电子科技大学 2012

硕士论文
[1]微博热点新闻的真实性验证及传播分析[D]. 姚思宇.大连理工大学 2016
[2]基于半监督学习的短文本分类研究[D]. 袁媛.西北师范大学 2015
[3]基于半监督学习的中文短文本分类研究[D]. 张倩.西安电子科技大学 2014
[4]互联网短文本信息分类关键技术研究[D]. 柴春梅.上海交通大学 2009
[5]基于语义分析树核的句子相似度计算[D]. 王利局.大连理工大学 2008



本文编号:2931248

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2931248.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99f34***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com