人机对话质量评估技术研究
发布时间:2022-02-24 19:01
伴随着信息咨询需求的不断增加,人机对话交互的场景越来越多。一般的对话中用户带着明确的目的而来,希望得到满足特定条件的信息或服务,例如:订餐,订票,寻找音乐、电影或某种商品等等,并且由于用户的需求可能比较复杂,需要分多轮进行陈述,用户也可能在对话过程中不断修改或完善自己的需求。此外,当用户的陈述的需求不够具体和明确的时候,机器也可以通过询问、澄清或确认来帮助用户找到满意的结果。因此需要从对话过程中提取出用户表达的信息特征,建立合适的对话质量评估模型,从而有助于人们去改善机器语言对话技巧,对提高用户咨询满意度具有重要意义。在本文工作中,将重点放在了多轮对话的语义特征上,利用多种深度网络模型去提取语言特征,并针对与中文对话提出相关模型,主要工作包括以下几个方面:本文首先利用统计的对话特征进行学习,包括LR、SVM、决策树等传统机器学习方法对人工添加时间特征的样本数据的训练以及以循环神经网络模型对交互历史特征的自动提取,结合所提出的各项指标结果对比发现神经网络模型能够有效地捕获对话序列特征。随后基于NLP相关研究基础,仅从对话文本出发,不再做人工特征的提取,提出了利用BiLSTM、1D-CNN...
【文章来源】:西安电子科技大学陕西省211工程院校教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 研究背景与意义
1.2 人机对话系统的发展
1.3 人机对话质量评估的研究现状
1.4 研究思路
1.5 本文结构
第二章 传统对话评估方法
2.1 引言
2.2 人机对话系统概述
2.2.1 LEGO公交查询系统介绍
2.2.2 数据集统计特征介绍
2.3 基于统计特征的模型介绍
2.3.1 传统机器学习模型
2.3.2 循环神经网络的模型
2.4 对话质量评估指标
2.5 实验及结果分析
2.5.1 加入时间窗的传统方法
2.5.2 循环神经网络模型
2.6 本章小结
第三章 基于NLP的对话质量评估
3.1 引言
3.2 词嵌入层
3.2.1 词袋模型
3.2.2 词查表
3.3 对话文本特征提取
3.3.1 BiLSTM模型
3.3.2 1D-CNN模型
3.3.3 Multi-head Attention
3.4 实验及结果分析
3.4.1 数据预处理
3.4.2 模型结果对比分析
3.4.3 文本加错实验
3.5 本章小结
第四章 中文对话系统的评估方法
4.1 引言
4.2 中文语言特性分析
4.2.1 分词方式
4.2.2 中文字形
4.3 基于CNN的对话象形特征提取
4.3.1 田字格CNN模型
4.3.2 群卷积模型
4.3.3 多任务辅助学习
4.3.4 整体模型
4.4 实验及结果分析
4.4.1 中文语料库的构建
4.4.2 汉字图像集
4.4.3 模型参数及结果分析
4.5 总结
第五章 总结与展望
5.1 本文工作总结
5.2 未来研究展望
参考文献
致谢
作者简介
【参考文献】:
期刊论文
[1]SIRI智能语音系统在汽车上的应用[J]. 刘思源. 中国新技术新产品. 2014(09)
[2]音频检索技术概述[J]. 张华. 广东通信技术. 2013(07)
[3]词典与统计方法结合的中文分词模型研究及应用[J]. 蒋建洪,赵嵩正,罗玫. 计算机工程与设计. 2012(01)
[4]中文分词算法概述[J]. 龙树全,赵正文,唐华. 电脑知识与技术. 2009(10)
本文编号:3643329
【文章来源】:西安电子科技大学陕西省211工程院校教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 研究背景与意义
1.2 人机对话系统的发展
1.3 人机对话质量评估的研究现状
1.4 研究思路
1.5 本文结构
第二章 传统对话评估方法
2.1 引言
2.2 人机对话系统概述
2.2.1 LEGO公交查询系统介绍
2.2.2 数据集统计特征介绍
2.3 基于统计特征的模型介绍
2.3.1 传统机器学习模型
2.3.2 循环神经网络的模型
2.4 对话质量评估指标
2.5 实验及结果分析
2.5.1 加入时间窗的传统方法
2.5.2 循环神经网络模型
2.6 本章小结
第三章 基于NLP的对话质量评估
3.1 引言
3.2 词嵌入层
3.2.1 词袋模型
3.2.2 词查表
3.3 对话文本特征提取
3.3.1 BiLSTM模型
3.3.2 1D-CNN模型
3.3.3 Multi-head Attention
3.4 实验及结果分析
3.4.1 数据预处理
3.4.2 模型结果对比分析
3.4.3 文本加错实验
3.5 本章小结
第四章 中文对话系统的评估方法
4.1 引言
4.2 中文语言特性分析
4.2.1 分词方式
4.2.2 中文字形
4.3 基于CNN的对话象形特征提取
4.3.1 田字格CNN模型
4.3.2 群卷积模型
4.3.3 多任务辅助学习
4.3.4 整体模型
4.4 实验及结果分析
4.4.1 中文语料库的构建
4.4.2 汉字图像集
4.4.3 模型参数及结果分析
4.5 总结
第五章 总结与展望
5.1 本文工作总结
5.2 未来研究展望
参考文献
致谢
作者简介
【参考文献】:
期刊论文
[1]SIRI智能语音系统在汽车上的应用[J]. 刘思源. 中国新技术新产品. 2014(09)
[2]音频检索技术概述[J]. 张华. 广东通信技术. 2013(07)
[3]词典与统计方法结合的中文分词模型研究及应用[J]. 蒋建洪,赵嵩正,罗玫. 计算机工程与设计. 2012(01)
[4]中文分词算法概述[J]. 龙树全,赵正文,唐华. 电脑知识与技术. 2009(10)
本文编号:3643329
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3643329.html