基于神经网络的两阶段文本摘要模型研究
发布时间:2024-01-27 06:06
随着互联网与移动互联网的高速发展,网络中的数据呈爆发式增长,如何在缩小数据规模的情况下保留数据中的信息量变得尤为重要。为了更好地提取大量文本中的信息,自然语言处理领域提出了自动文本摘要生成任务。自动文本摘要通过计算机自动化地提取文本主要内容并进行压缩,从而帮助人们快速获取知识。的方法主要分为抽取式方法和生成式方法两种。抽取式摘要可以较为准确地提取原文中的要点,但是摘要句子的排序以及连贯性差是其存在主要问题。生成式摘要主要通过端到端的神经网络模型直接生成摘要,大量训练后生成的文本流畅性较强,但是由于这些模型都是黑盒模型,生成过程无法控制,难以准确涵盖原文要点。针对目前自动文本摘要方法存在的问题,本文提出了结合抽取式方法和生成式方法的两阶段模型,并提出了利用摘要句重要性评估理论模型改进抽取式方法与利用覆盖机制改进生成模型,从而提高模型效果。主要工作和贡献如下:(1)提出了神经网络模型与理论模型相结合的摘要抽取器,该方法首先利用卷积神经网络改进了神经网络句子分类模型,然后通过对分类模型得到的关键句子运用动态规划算法进行打分,最后将得分最高的摘要句子集合作为最终的摘要结果。(2)通过加入覆盖向...
【文章页数】:77 页
【学位级别】:硕士
本文编号:3886446
【文章页数】:77 页
【学位级别】:硕士
图1-1两阶段框架
图2-21编码-解码框架结构图
图32-2注意力机制原理图
图2-3放缩点积注意力机制原理图
本文编号:3886446
本文链接:https://www.wllwen.com/tushudanganlunwen/3886446.html
教材专著