基于深度学习的文本关键词生成研究
发布时间:2023-01-26 08:30
随着互联网技术的不断发展,现在的社会已经步入了大数据时代,其中文本数据更是呈指数形式增长,人们难以快速地从海量的文本信息中甄别出符合需求的信息。关键词作为文本主题信息的高度凝结,可以帮助人们快速地了解文本的核心内容。同时,关键词也可以应用于文本分类、文献检索、自动摘要、推荐系统等自然语言处理任务。因此,关键词抽取技术变得尤为重要,但是传统的关键词抽取模型存在两点不足:1)大多只能抽取出现在原文中的词语;2)主要依赖文本浅层特征抽取重要的词语,因此难以挖掘并充分利用文本背后的潜在语义信息。近年来,基于神经网络的关键词生成模型能够较好地克服上述抽取模型的局限性,但现有的关键词生成模型得到的关键词依然存在偏离原文内容的问题。为了缓解上述问题,本文将关键词抽取模型和关键词生成模型相结合,快速聚焦于原文核心内容,并尝试多种的融合方式来提高模型生成关键词的质量,本文的主要研究工作如下:第一,当生成文本关键词时,人们通常会从文本中提取重要信息,然后再基于对重要信息的理解来生成关键词,基于此,本文提出通过TextRank算法抽取出文本当中包含重要信息的词语和句子,然后将抽取的重要信息与深度学习模型相结...
【文章页数】:49 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文的主要研究工作
1.4 论文的组织结构
第二章 文本关键词抽取与生成研究综述
2.1 文本关键词抽取方法
2.1.1 基于统计的关键词抽取
2.1.2 基于图模型的关键词抽取
2.1.3 基于主题模型的关键词抽取
2.1.4 基于神经网络模型的关键词抽取
2.2 文本关键词生成方法
2.2.1 基本序列到序列模型
2.2.2 注意力机制
2.2.3 复制机制
2.3 文本关键词评价方法
第三章 融合重要信息抽取的关键词生成模型
3.1 引言
3.2 融合重要信息的注意力机制
3.3 融合重要信息抽取的关键词生成模型
3.4 实验
3.4.1 实验数据
3.4.2 实验设置
3.4.3 对比模型
3.4.4 实验结果
3.5 本章小结
第四章 基于多粒度重要信息引导的关键词生成模型
4.1 引言
4.2 基于多粒度重要信息引导的关键词生成模型
4.3 实验
4.3.1 实验数据
4.3.2 实验设置
4.3.3 对比模型
4.3.4 实验结果
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读硕士期间发表的学术成果
致谢
本文编号:3732356
【文章页数】:49 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文的主要研究工作
1.4 论文的组织结构
第二章 文本关键词抽取与生成研究综述
2.1 文本关键词抽取方法
2.1.1 基于统计的关键词抽取
2.1.2 基于图模型的关键词抽取
2.1.3 基于主题模型的关键词抽取
2.1.4 基于神经网络模型的关键词抽取
2.2 文本关键词生成方法
2.2.1 基本序列到序列模型
2.2.2 注意力机制
2.2.3 复制机制
2.3 文本关键词评价方法
第三章 融合重要信息抽取的关键词生成模型
3.1 引言
3.2 融合重要信息的注意力机制
3.3 融合重要信息抽取的关键词生成模型
3.4 实验
3.4.1 实验数据
3.4.2 实验设置
3.4.3 对比模型
3.4.4 实验结果
3.5 本章小结
第四章 基于多粒度重要信息引导的关键词生成模型
4.1 引言
4.2 基于多粒度重要信息引导的关键词生成模型
4.3 实验
4.3.1 实验数据
4.3.2 实验设置
4.3.3 对比模型
4.3.4 实验结果
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读硕士期间发表的学术成果
致谢
本文编号:3732356
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3732356.html