当前位置:主页 > 科技论文 > 软件论文 >

基于深度学习的安全新闻流行度预测研究

发布时间:2021-04-03 23:32
  新闻流行度预测是对新闻在未来时刻的点击量、评论数或者转发量的预测,通过对流行度的预测能够进行新闻质量评估,新闻排名,新闻推荐以及新闻检索等。新闻流行度的预测还能够缓解当今网络及社交媒体飞速发展带来的信息爆炸和信息过载问题。但是由于新闻存在时效性且生命周期较短为发布后的预测带来局限性,而发布前预测由于影响因素的多样性和难定义性也面临巨大的挑战。已有工作中对新闻进行发布前的流行度预测存在无法处理多源粗糙数据集且预测误差较大的问题。本文提出了一种基于Doc2vec的改进图排序关键句提取算法抽取新闻关键句;基于新闻表面信息和关键句以多特征融合的方式进行特征提取;结合神经网络结构门限循环单元训练回归预测模型并提出了一种能够处理多源粗糙数据集且极大降低预测误差的新闻流行度预测框架。本文的工作内容主要包括以下四点:(1)本文设计网络爬虫得到了来自国内10个信息安全门户网站的不同类型、不同结构的新闻数据,经过对数据的去重以及过滤等预处理操作后构造了可用于新闻分类、流行度预测以及自然语言处理等领域的中文数据集共25939条。(2)对新闻发布前进行流行度预测主要依赖新闻自身信息,不同来源、不同类型的新闻具... 

【文章来源】: 孔君莉 西安电子科技大学

【文章页数】:77 页

【学位级别】:硕士

【部分图文】:

基于深度学习的安全新闻流行度预测研究


k=3关键句提取结果例图一

关键句,根据需要,取值


图4.3 k=3 关键句提取结果例图二在进行关键句提取时可以根据需要设置 k 的取值决定关键句的提取数量。为观察该算法在本文数据集上的关键句提取效果,本文随机选择数据集中的新 k 的取值分别设为 3 和 5 进行关键句提取。因关键句的提取受主观影响因素较大导致新闻关键句自动提取领域结果的是该领域面临的挑战,目前在该领域对摘要结果的评价方法主要分为人工评指标评价两种方法。人工评价通过人为对提取结果的概括性、可读性进行判用指标评价时其主要参考依据为提取结果与参照摘要的重合比例。由于本文具备参照摘要,因此将在线系统提取结果作为参照摘要并与之对比。对本文数据集中任意新闻,将 k 设置为 3 时,本文方法与在线系统的对比结4.5 所示,提取的 3 句关键句中,二者存在 2 句相同分句。上文提到,k 值的了提取关键句的数量,将 k 设置为 5,仍然以在线系统的提取结果作为参照果如图 4.4 所示。在线系统与本文提取结果的相同分句数量为 3 句,而其中键句中也存在代表核心内容的重叠词汇。

关键句,结果对比,在线系统


39图4.4 k=5 关键句提取结果对比例图当 k=3 和 k=5 时本文算法的提取结果与在线系统提取结果的覆盖比例如表 4.4 所示,以数据集中任意一篇新闻为例,当关键句数量分别设为 3 和 5 时,通过本文算法提取结果与在线系统相比分别有 2/3 和 3/5 的覆盖比例。本文提取结果与参照摘要存在较高的覆盖率,而本文的提取结果与在线系统相比考虑了句子自身的所处位置这一特征因此能够保证句子在原文中的前后关系。

【参考文献】:
期刊论文
[1]基于改进TextRank算法的中文文本摘要提取[J]. 徐馨韬,柴小丽,谢彬,沈晨,王敬平.  计算机工程. 2019(03)
[2]循环神经网络研究综述[J]. 杨丽,吴雨茜,王俊丽,刘义理.  计算机应用. 2018(S2)
[3]基于词向量Doc2vec的双向LSTM情感分析[J]. 张俊飞,毕志升,吴小玲.  计算机与数字工程. 2018(12)
[4]面向查询的自动文本摘要技术研究综述[J]. 王凯祥.  计算机科学. 2018(S2)
[5]基于CNN和BiLSTM网络特征融合的文本情感分析[J]. 李洋,董红斌.  计算机应用. 2018(11)
[6]基于TextRank的文本情感摘要提取方法[J]. 荀静,杨玉珍.  计算机应用与软件. 2018(10)
[7]结合Doc2Vec与改进聚类算法的中文单文档自动摘要方法研究[J]. 贾晓婷,王名扬,曹宇.  数据分析与知识发现. 2018(02)
[8]基于多特征的微博情感分析研究[J]. 刘续乐,何炎祥.  计算机工程. 2017(12)
[9]基于词向量技术和混合神经网络的情感分析[J]. 胡朝举,赵晓伟.  计算机应用研究. 2018(12)
[10]基于Word2vec的句子语义相似度计算研究[J]. 李晓,解辉,李立杰.  计算机科学. 2017(09)

硕士论文
[1]基于深度神经网络的中文命名实体识别研究[D]. 顾孙炎.南京邮电大学 2018
[2]基于TextRank算法的单文档自动文摘研究[D]. 曹洋.南京大学 2016



本文编号:3117290

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3117290.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7e9a9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com