检索式对话系统中的主题建模设计与实现
发布时间:2021-05-12 03:04
近年来,开放域(闲聊型)对话系统越来越受到人们的关注,相对于传统信息服务形式(如问答系统、搜索引擎等),开放域对话系统提供更丰富语义内容和更有效的交互模式,这些特性使得其在可预见的未来生活中越来越普及,因此开放域对话系统相关技术的研究具有极大的经济效应和社会价值。随着深度学习在自然语言处理领域的飞速发展,对话系统正伴随着便携移动设备市场的拓展走向成熟,在客服、金融、医疗、教育和生活服务等方面应用广泛。开放域对话系统按照其回复产生的方式可以分为检索式与生成式两种方式:检索式对话系统通过匹配技术从系统回复库中检索与用户查询匹配的话语并排序,选取出排名最高的回复,该方法具有回复质量高的特点,但是其依赖于人工撰写的大量对话数据;而生成式对话系统基于数据驱动的方法能训练回复生成模型,该方法具有灵活性更好并可自动生成新的回复等特点,但是容易生成通用的无内容回复。目前的开放域对话模型研究工作大多基于神经网络的方法,由一个端到端的神经网络模型产生对话回复或者对候选回复排序。这种端到端模型的缺点在于难以解释对话的生成或排序过程。为了增加对话过程的可解释性并避免开放域对话系统两类方法的主要问题,本课题研究...
【文章来源】:江西师范大学江西省
【文章页数】:47 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 概述
1.1 研究背景与研究意义
1.2 本文的研究内容
1.3 本文章节安排
2 国内外相关研究
2.1 对话系统相关技术
2.2 检索式对话技术
2.3 对话主题建模相关技术
2.4 研究现状小结
3 对话的主题抽取建模
3.1 主题词抽取方法
3.1.1 基于BiLSTM+CRF的方法
3.1.2 结合分词信息
3.2 主题向量抽取方法
3.3 实验数据及数据预处理
3.3.1 实验数据
3.3.2 数据预处理
3.3.3 数据标注
3.4 实验设置与结果分析
3.5 本章小结
4 对话主题与主题词预测建模
4.1 引言
4.2 基于多标签分类的关键词预测
4.2.1 基于CNN的主题词预测模型
4.3 基于序列生成的关键词预测
4.3.1 基于Seq2Seq生成模型的关键词预测
4.4 主题预测
4.5 实验设置与结果分析
4.5.1 实验数据与评价指标
4.5.2 实验设置与结果分析
4.6 本章小结
5 基于主题的检索式对话系统及系统开发
5.1 引言
5.2 回复排序算法
5.2.1 对偶长短期记忆模型(dual-LSTM)
5.2.2 深度注意力匹配模型(DAM)
5.3 系统实现
5.4 系统展示
5.5 系统效果分析
5.6 本章小结
6 总结与展望
6.1 本文工作总结
6.2 未来工作展望
参考文献
致谢
在读期间公开发表论文(著)及科研情况
本文编号:3182609
【文章来源】:江西师范大学江西省
【文章页数】:47 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 概述
1.1 研究背景与研究意义
1.2 本文的研究内容
1.3 本文章节安排
2 国内外相关研究
2.1 对话系统相关技术
2.2 检索式对话技术
2.3 对话主题建模相关技术
2.4 研究现状小结
3 对话的主题抽取建模
3.1 主题词抽取方法
3.1.1 基于BiLSTM+CRF的方法
3.1.2 结合分词信息
3.2 主题向量抽取方法
3.3 实验数据及数据预处理
3.3.1 实验数据
3.3.2 数据预处理
3.3.3 数据标注
3.4 实验设置与结果分析
3.5 本章小结
4 对话主题与主题词预测建模
4.1 引言
4.2 基于多标签分类的关键词预测
4.2.1 基于CNN的主题词预测模型
4.3 基于序列生成的关键词预测
4.3.1 基于Seq2Seq生成模型的关键词预测
4.4 主题预测
4.5 实验设置与结果分析
4.5.1 实验数据与评价指标
4.5.2 实验设置与结果分析
4.6 本章小结
5 基于主题的检索式对话系统及系统开发
5.1 引言
5.2 回复排序算法
5.2.1 对偶长短期记忆模型(dual-LSTM)
5.2.2 深度注意力匹配模型(DAM)
5.3 系统实现
5.4 系统展示
5.5 系统效果分析
5.6 本章小结
6 总结与展望
6.1 本文工作总结
6.2 未来工作展望
参考文献
致谢
在读期间公开发表论文(著)及科研情况
本文编号:3182609
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3182609.html