面向任务的对话状态追踪方法及应用
发布时间:2021-01-24 21:07
对话状态追踪是面向任务的多轮对话系统中的重要组成部分,旨在根据对话上下文估计每轮对话中的用户目标和请求,为对话决策提供决策依据。传统的对话状态追踪方法将口语理解的结果作为对话状态追踪模块的输入,存在误差传递的问题;并且随着用户与系统的对话轮次不断增加,传统方法在新槽值和罕见槽值的识别上难以达到较高的准确率。本文为改善这些缺点,设计了基于神经网络的状态追踪方法,并对对话状态追踪模型在知识驱动对话系统中的重要作用进行了探究。为了解决多轮对话系统中新槽值及罕见槽值的识别问题,本文提出了基于局部槽特征的模型。该模型将局部的槽信息作为特征,借助注意力机制与LSTM(Long Short-Term Memory,长短期记忆网络)在不同槽信息的基础上学习用户当前输入、上一轮系统动作及候选槽值的特征表示,模型利用学习到的表示对候选的槽值进行评估,从而生成对话状态。该模型在两个公开数据集上进行了实验,实验结果表明,本文提出的模型在两个状态追踪数据集上都有较好的识别准确率及较快的运行速度。该模型简单有效并能在不同槽信息的环境下学习到每个槽的特征,有利于罕见槽值和新槽值的识别。针对上述模型中对所有候选槽值建...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
人机对话系统组成部分[1]152对话管理由对话状态追踪(DialogueStateTracker,DST)和对话策略
哈尔滨工业大学工学硕士学位论文-21-新槽值及罕见槽值的识别。在LSDST模型架构中,如图3-1所示,模型中包括编码模块及评估模块,首先将用户的当前输入、系统上一轮动作以及所有的候选槽值对送入到基于不同槽信息的编码器中,并结合注意力机制获得上下文的向量表示(c,h)。再将该表示作为状态评估模块的输入,结合系统动作评估模块及用户话语评估模块为每个候选槽值对进行打分。图3-1LSDST模型示意图LSDST+SU模型在LSDST模型的基础上,引入了对话历史信息,利用编码模块对上一轮的系统回复文本进行编码,并在状态评估模块与用户输入信息联合建模,实现对候选槽值的打分,与如图3-2所示。图3-2LSDST+SU模型示意图
哈尔滨工业大学工学硕士学位论文-21-新槽值及罕见槽值的识别。在LSDST模型架构中,如图3-1所示,模型中包括编码模块及评估模块,首先将用户的当前输入、系统上一轮动作以及所有的候选槽值对送入到基于不同槽信息的编码器中,并结合注意力机制获得上下文的向量表示(c,h)。再将该表示作为状态评估模块的输入,结合系统动作评估模块及用户话语评估模块为每个候选槽值对进行打分。图3-1LSDST模型示意图LSDST+SU模型在LSDST模型的基础上,引入了对话历史信息,利用编码模块对上一轮的系统回复文本进行编码,并在状态评估模块与用户输入信息联合建模,实现对候选槽值的打分,与如图3-2所示。图3-2LSDST+SU模型示意图
【参考文献】:
博士论文
[1]基于级联神经网络的对话状态追踪技术研究与实现[D]. 杨国花.北京邮电大学 2019
本文编号:2997933
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
人机对话系统组成部分[1]152对话管理由对话状态追踪(DialogueStateTracker,DST)和对话策略
哈尔滨工业大学工学硕士学位论文-21-新槽值及罕见槽值的识别。在LSDST模型架构中,如图3-1所示,模型中包括编码模块及评估模块,首先将用户的当前输入、系统上一轮动作以及所有的候选槽值对送入到基于不同槽信息的编码器中,并结合注意力机制获得上下文的向量表示(c,h)。再将该表示作为状态评估模块的输入,结合系统动作评估模块及用户话语评估模块为每个候选槽值对进行打分。图3-1LSDST模型示意图LSDST+SU模型在LSDST模型的基础上,引入了对话历史信息,利用编码模块对上一轮的系统回复文本进行编码,并在状态评估模块与用户输入信息联合建模,实现对候选槽值的打分,与如图3-2所示。图3-2LSDST+SU模型示意图
哈尔滨工业大学工学硕士学位论文-21-新槽值及罕见槽值的识别。在LSDST模型架构中,如图3-1所示,模型中包括编码模块及评估模块,首先将用户的当前输入、系统上一轮动作以及所有的候选槽值对送入到基于不同槽信息的编码器中,并结合注意力机制获得上下文的向量表示(c,h)。再将该表示作为状态评估模块的输入,结合系统动作评估模块及用户话语评估模块为每个候选槽值对进行打分。图3-1LSDST模型示意图LSDST+SU模型在LSDST模型的基础上,引入了对话历史信息,利用编码模块对上一轮的系统回复文本进行编码,并在状态评估模块与用户输入信息联合建模,实现对候选槽值的打分,与如图3-2所示。图3-2LSDST+SU模型示意图
【参考文献】:
博士论文
[1]基于级联神经网络的对话状态追踪技术研究与实现[D]. 杨国花.北京邮电大学 2019
本文编号:2997933
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2997933.html
最近更新
教材专著