基于子词单元的深度学习摘要生成方法
发布时间:2023-10-21 16:06
现有的生成式文本摘要方法存在一些局限,包括难以产生可靠的源文本表示,产生的摘要句与源文本的语义相似度较低,存在集外词问题等。对此提出一种混合神经网络编码器结构,对源文本的长距依赖和上下文信息进行捕捉,得到高质量的文本表示;提出一种基于关键短语的重排序机制,利用源文本中抽取的关键短语对集束搜索生成的候选序列进行重新排序,以减小其与源文本语义上的距离;对文本进行子词单元提取,利用更细粒度的单元对文本进行表示。该方法在不同长度的摘要数据集上进行实验,均取得了良好的效果。
【文章页数】:7 页
【文章目录】:
0 引 言
1 相关工作
2 问题形式化描述
3 算法设计与实现
3.1 基于子词单元的文本表示
3.2 结合注意力机制的编码器-解码器结构
3.3 基于关键短语的重排序机制
4 实 验
4.1 数据集及实验设置
4.2 实验结果与分析
4.2.1 句子摘要任务
4.2.2 标题生成任务
4.3 实例分析
5 结 语
本文编号:3856169
【文章页数】:7 页
【文章目录】:
0 引 言
1 相关工作
2 问题形式化描述
3 算法设计与实现
3.1 基于子词单元的文本表示
3.2 结合注意力机制的编码器-解码器结构
3.3 基于关键短语的重排序机制
4 实 验
4.1 数据集及实验设置
4.2 实验结果与分析
4.2.1 句子摘要任务
4.2.2 标题生成任务
4.3 实例分析
5 结 语
本文编号:3856169
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3856169.html