当前位置:主页 > 科技论文 > 自动化论文 >

面向客服辅助领域的任务型对话研究

发布时间:2020-07-20 22:00
【摘要】:近年来,随着人工智能技术的飞速发展,基于自然语言的任务型对话研究得到了学术界乃至工业界的诸多关注。当前的客服对话主要以人工参与为主,因此如何提高智能客服的服务体验与落地可实施性是本文研究的重点。将自然语言对话研究加入到客服对话领域可以有效降低人力消耗,提高客服对话的效率。任务型对话主要的研究方向可分为检索式和生成式两种,检索式方法在限定领域内表现顺畅,生成式方法回复的内容更具创新性。由于深度学习方法可以有效提取语义特征和上下文的互信息,因此为本文提供了新的研究思路。本文主要是面向客服辅助领域的任务型对话研究,重点从以下三个方向进行研究:面向客服辅助领域的检索式对话研究。传统对话研究主要基于知识库检索和回复匹配,本文依次实现了WMD、BM25和SMN三种检索式对话模型。经实验对比发现,加入深度语义理解的SMN模型在准确率上接近40%,明显优于其他两者,由此表明深度学习方法有利于提取语义特征信息。面向客服辅助领域的生成式对话研究。循环神经网络具有记忆功能、参数共享等特性,且善于处理序列化的数据信息。本文实现了seq2seq的基线模型,并使用LSTM和Bi-LSTM改进模型编码,丰富语义信息表达;在此基础上引入注意力机制,提升模型的解码能力。改进后的实验模型最终达到68.3%的准确率,相比基线模型提升许多,这说明深度学习方法对于语义信息理解效果显著,但实验精度还有待提高。综上,将检索与生成相结合进行实验对话研究。本文将检索信息和检索信息的主题词分别加入到生成模型的编码和解码部分,用以丰富模型信息编码和改善模型解码结果,最优实验结果达到77.41%。为了增加对话模型的落地可行性,在此基础上又添加了任务式对话,与检索式对话和生成式对话基于一定的策略相结合,最后测试实验结果达到88.71%。最终,综合模型汇集了检索与生成的优点,且在对话的效率以及服务体验上都大幅提升,经试验证明,该方案更具落地的可实施性。
【学位授予单位】:江西农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP18
【图文】:

框架图,匹配模型,框架,检索式


2 面向客服辅助领域的检索式对话研究十年代,检索就被率先应用到对话领域,由于其操在多个领域有很好的应用。检索式对话需要检索工出候选回复,然后对候选回复进行打分排序,最后复[32]。检索式对话所使用的数据均需经过预先处理复内容古板没有创新,无法回答领域外的问题。主要提取问句与候选回复之间的特征信息,使用机模型,返回匹配度最高的匹配结果。文本信息特征文本信息表示成数据信息,但传统信息特征提取只深入理解文本的语义信息。随着深度学习在自然语的被应用于提取文本的语义信息,将文本信息进行研究方向是问句与候选回复的匹配程度,在对候选据匹配模型进行相关度打分,最后得到候选回复的话任务上的基本框架如图 2.1 所示。

相似度,汉语词典,词赋,向量


容处理简化为向量空间中方式为余弦相似度。有两种,其二是使用 TF-IDF 衡量档转换为单独的词(term,定义一个 M 维的向量(给这个词赋一个实数值或,如 20 万个词的汉语词典疏。当文档转换为向量后。空间向量表示完成,可以如(2-1)所示。cosθ (( )( 知识库中挑选候选回复,和回复文本,然后将测试样回相似度较大的候选回复

欧式距离,文本,相似性,度量关系


(Word Mover’s Distance)是计算句子之间距离的方法,主要用于似度,距离越小其相似度越高。WMD 模型衍生于 EMD(Eart模型,他们都是定义距离度量关系,用于测量两个分布的距离,语音信号处理。WMD 将这种思想的使用范围延伸到自然语言领效。况下,计算文本距离时率先想到的是使用 word2vec 对两段文本然后再使用欧式距离或余弦相似性进行求解。不过 word2vec 获映词与词之间的语义差别,但无法从文档的整体来考虑相似性,下文信息缺失,因此使用 WMD 来计算文本整体相似度。想要反相似度,就需要将文档距离建模成两个文本语义距离的组合,比的任意两个词所对应的词向量求欧式距离并加权求和,表示形式示。, ( , ) ( , )为 , 两个词对应词向量的欧式距离,T 表示加权矩阵,类似于移矩阵,将其概率转化为权重,以下通过图 2.3 对其原理做详细

【相似文献】

相关期刊论文 前10条

1 廖祥文;谢媛媛;魏晶晶;桂林;程学旗;陈国龙;;基于卷积记忆网络的视角级微博情感分类[J];模式识别与人工智能;2018年03期

2 张学武;刘广聪;蔡念;;基于Attention-biLSTM的候选答案句抽取[J];福建电脑;2019年04期

3 雷叶;;从餐馆评论中提取方面术语[J];智能计算机与应用;2019年03期

4 张俊青;孔芳;;基于序列到序列模型的事件识别[J];中文信息学报;2019年06期

5 张家颖;杨文军;;基于深度学习的网络流量分类识别研究[J];天津理工大学学报;2019年06期

6 李家乐;吴明礼;;基于深度学习的问题回答技术研究[J];数字技术与应用;2019年02期

7 刘蕊;沈海斌;;序列—结构的文本分类算法[J];电子技术;2018年02期

8 王翰林;何中市;;基于Faster R-CNN的复杂背景下的人脸检测[J];现代计算机(专业版);2019年07期

9 孙鑫;王厚峰;;问答中的问句意图识别和约束条件分析[J];中文信息学报;2017年06期

10 董叶豪;柯宗武;熊旭辉;孙玉霞;夏端峰;;基于Seq2Seq的问答系统应用研究[J];福建电脑;2018年10期

相关硕士学位论文 前7条

1 刘治成;基于出租车轨迹数据的目标车辆轨迹恢复算法研究[D];哈尔滨工业大学;2019年

2 刘芝鹏;面向客服辅助领域的任务型对话研究[D];江西农业大学;2019年

3 龚琴;基于深度学习的电商产品评论情感分析研究[D];重庆邮电大学;2019年

4 纪清晨;基于深度学习的行人属性识别研究[D];哈尔滨工业大学;2019年

5 刘冲;基于深度学习的流量分类系统[D];北京邮电大学;2019年

6 张赏;基于本体的地理知识问答[D];东南大学;2018年

7 王新波;用户评论方面级情感分析算法研究[D];北京邮电大学;2018年



本文编号:2764005

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2764005.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户674d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com