面向对话系统回复质量的自动评价研究
发布时间:2022-12-07 18:27
随着人工智能的飞速发展,人机交互的形态也在发生着变化,人机对话开始出现在我们生活的方方面面,深度学习的飞速发展更是将人机对话任务向前推进了一大步。人机对话任务的研究不仅仅在学术界产生了大量的成果,也在我们的生活中生根发芽。然而即使在对话技术日新月异的现在,如何对对话系统回复质量进行评价还是一个没有被完全解决的问题。本文通过对不同对话系统任务的分析和研究,结合现有的对话系统回复质量评价指标和方法,分别对不同的对话系统类型进行了不同的评价实验,通过合理的数据集构造和实验设计,将目前的对话系统回复质量评价方法做了一系列的总结和归纳。在总结归纳的基础上,本文还提出了新的对话系统回复质量评价方法,通过对不同类型对话系统回复质量评价的方法总结,探讨了目前对话系统回复质量评价的现况和存在的问题,并针对一些问题提出了新的解决思路。本文针对任务型对话系统回复质量评价进行了尝试性的实验并取得了较好的结果,构造的数据集来源多样,从而可以在一定程度上可以实现对模型的迁移和重构,此外还针对任务型对话系统的特征进行了选择和实验,从更细节的角度探索了任务型对话系统回复质量评价的方法。针对开放域对话系统回复质量评价,...
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.1.1 课题背景
1.1.2 课题研究的目的和意义
1.2 国内外研究现状
1.2.1 国内外研究现状
1.2.2 国内外研究现状总结
1.3 本文的研究内容及章节安排
1.3.1 本文的研究内容
1.3.2 本文的章节安排
第2章 基于统计机器学习方法的任务型对话系统回复质量评价
2.1 引言
2.2 数据集构建
2.2.1 SMP2017-ecdt中任务型对话系统评测数据
2.2.2 聊天机器人笨笨日志中任务型对话部分数据
2.3 机器学习模型分类方法及特征提取
2.3.1 传统机器学习模型分类方法
2.3.2 特征抽取
2.4 实验设计与分析
2.4.1 实验设计
2.4.2 评价指标
2.4.3 实验结果分析
2.5 本章小结
第3章 基于传统方法的开放域对话系统自动评价
3.1 引言
3.2 数据集构造
3.2.1 Daily Dialogue数据集
3.2.2 Seq2Seq模型生成数据
3.2.3 随机方法生成的数据
3.3 基于传统评价指标的开放域对话系统回复质量评价研究
3.3.1 基于词重叠率的评价指标
3.3.2 基于词向量的评价矩阵
3.3.3 基于传统指标的开放域对话系统回复质量评价实验
3.4 基于统计机器学习方法的开放域对话系统回复质量评价研究
3.4.1 实验设计
3.4.2 评价指标
3.4.3 实验结果分析
3.5 本章小结
第4章 基于深度学习的开放域对话系统自动评价
4.1 引言
4.2 生成对抗网络(GAN)方法
4.2.1 生成对抗网络基本原理
4.2.2 生成对抗网络的应用
4.3 数据及特征的表示方法
4.4 实验设计与分析
4.4.1 实验设计
4.4.2 实验结果
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢
【参考文献】:
期刊论文
[1]任务型人机对话系统中的认知技术——概念、进展及其未来[J]. 俞凯,陈露,陈博,孙锴,朱苏. 计算机学报. 2015(12)
[2]词袋模型在盲人家居视觉辅助系统中的应用[J]. 艾浩军,张敏,朱荣. 武汉理工大学学报(信息与管理工程版). 2011(06)
[3]基于统计学习的自然语言对话系统的设计与实现[J]. 李伟通,皮德常. 微计算机应用. 2008(07)
[4]基于Agent的人机对话系统的设计与实现[J]. 徐凯华,张德干,姚琳. 计算机工程. 2007(16)
本文编号:3712622
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.1.1 课题背景
1.1.2 课题研究的目的和意义
1.2 国内外研究现状
1.2.1 国内外研究现状
1.2.2 国内外研究现状总结
1.3 本文的研究内容及章节安排
1.3.1 本文的研究内容
1.3.2 本文的章节安排
第2章 基于统计机器学习方法的任务型对话系统回复质量评价
2.1 引言
2.2 数据集构建
2.2.1 SMP2017-ecdt中任务型对话系统评测数据
2.2.2 聊天机器人笨笨日志中任务型对话部分数据
2.3 机器学习模型分类方法及特征提取
2.3.1 传统机器学习模型分类方法
2.3.2 特征抽取
2.4 实验设计与分析
2.4.1 实验设计
2.4.2 评价指标
2.4.3 实验结果分析
2.5 本章小结
第3章 基于传统方法的开放域对话系统自动评价
3.1 引言
3.2 数据集构造
3.2.1 Daily Dialogue数据集
3.2.2 Seq2Seq模型生成数据
3.2.3 随机方法生成的数据
3.3 基于传统评价指标的开放域对话系统回复质量评价研究
3.3.1 基于词重叠率的评价指标
3.3.2 基于词向量的评价矩阵
3.3.3 基于传统指标的开放域对话系统回复质量评价实验
3.4 基于统计机器学习方法的开放域对话系统回复质量评价研究
3.4.1 实验设计
3.4.2 评价指标
3.4.3 实验结果分析
3.5 本章小结
第4章 基于深度学习的开放域对话系统自动评价
4.1 引言
4.2 生成对抗网络(GAN)方法
4.2.1 生成对抗网络基本原理
4.2.2 生成对抗网络的应用
4.3 数据及特征的表示方法
4.4 实验设计与分析
4.4.1 实验设计
4.4.2 实验结果
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢
【参考文献】:
期刊论文
[1]任务型人机对话系统中的认知技术——概念、进展及其未来[J]. 俞凯,陈露,陈博,孙锴,朱苏. 计算机学报. 2015(12)
[2]词袋模型在盲人家居视觉辅助系统中的应用[J]. 艾浩军,张敏,朱荣. 武汉理工大学学报(信息与管理工程版). 2011(06)
[3]基于统计学习的自然语言对话系统的设计与实现[J]. 李伟通,皮德常. 微计算机应用. 2008(07)
[4]基于Agent的人机对话系统的设计与实现[J]. 徐凯华,张德干,姚琳. 计算机工程. 2007(16)
本文编号:3712622
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3712622.html