融合文本主题信息的中文生成式自动摘要研究
发布时间:2025-01-20 17:27
互联网上包含数十亿的文本信息,并且每天都以指数级形式飞速增长,人们难以快速、准确地从这些文本中甄别出有价值的信息。因此,有必要提供一种可以及时访问和快速消化各种信息的工具来缓解信息过载问题。自动摘要可以将一篇或多篇长文本精简、提炼成一段包含最重要信息的短文本,能够缓解人们的阅读负担。近年来,随着深度学习算法、大数据和硬件算力的迅猛发展,基于注意力机制的序列到序列模型在生成式自动摘要任务中取得成功,得到学术界的广泛研究。然而,现有的摘要模型生成的摘要存在着内容不准确、摘要不充分等缺点,针对这个问题,本文利用关键词作为原文的主题信息并融合到指针生成网络模型中,从而提高模型生成摘要的质量。本文的主要研究工作如下:第一,注意力机制通常用于获取目标词与原文的对齐信息,但是难以识别原文所蕴含的主题内容,传递给解码器的上下文向量缺少对原文主题信息的归纳能力。而人在写摘要时,往往会参考文档中的主题信息,这些主题信息通常以关键词或中心句的方式呈现。鉴于此,本文通过抽取关键词来挖掘原文的主题信息,并将其显式地整合到注意力机制中,从而让模型在有全局主题信息指导的情况下,以上下文感知的方式生成面向主题的摘要。具...
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 抽取式自动摘要
1.2.2 生成式自动摘要
1.3 本文的主要研究工作
1.4 论文的组织结构
第二章 生成式自动摘要研究综述
2.1 序列到序列模型
2.2 注意力机制
2.3 摘要搜索算法
2.4 自动摘要评价方法
第三章 基于全局主题关键词的指针生成网络模型
3.1 引言
3.2 文本主题关键词
3.3 算法模型
3.3.1 模型整体架构
3.3.2 主题关键词抽取
3.3.3 指针生成网络模型
3.3.4 融合关键词信息的注意力机制
3.3.5 覆盖机制与目标函数
3.4 实验
3.4.1 实验数据
3.4.2 实验设置
3.4.3 对比模型
3.4.4 实验结果与分析
3.5 本章小结
第四章 基于主题关键词注意力机制的指针生成网络模型
4.1 引言
4.2 算法模型
4.2.1 模型整体架构
4.2.2 主题关键词注意力机制
4.3 实验
4.3.1 实验设置
4.3.2 对比模型
4.3.3 实验结果与分析
4.4 本章小结
第五章 总结与展望
5.1 研究总结
5.2 工作展望
参考文献
攻读硕士期间发表的学术成果
致谢
本文编号:4029441
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 抽取式自动摘要
1.2.2 生成式自动摘要
1.3 本文的主要研究工作
1.4 论文的组织结构
第二章 生成式自动摘要研究综述
2.1 序列到序列模型
2.2 注意力机制
2.3 摘要搜索算法
2.4 自动摘要评价方法
第三章 基于全局主题关键词的指针生成网络模型
3.1 引言
3.2 文本主题关键词
3.3 算法模型
3.3.1 模型整体架构
3.3.2 主题关键词抽取
3.3.3 指针生成网络模型
3.3.4 融合关键词信息的注意力机制
3.3.5 覆盖机制与目标函数
3.4 实验
3.4.1 实验数据
3.4.2 实验设置
3.4.3 对比模型
3.4.4 实验结果与分析
3.5 本章小结
第四章 基于主题关键词注意力机制的指针生成网络模型
4.1 引言
4.2 算法模型
4.2.1 模型整体架构
4.2.2 主题关键词注意力机制
4.3 实验
4.3.1 实验设置
4.3.2 对比模型
4.3.3 实验结果与分析
4.4 本章小结
第五章 总结与展望
5.1 研究总结
5.2 工作展望
参考文献
攻读硕士期间发表的学术成果
致谢
本文编号:4029441
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4029441.html
最近更新
教材专著