Cas-GAN:一种基于GAN和强化学习的对话管理策略学习方法
发布时间:2020-03-29 04:58
【摘要】:对话管理系统在日常生活中有广泛的应用,如在线购物,酒店预订和驾驶预订。在对话管理系统中,用户通过多轮对话与系统交互。有效的对话管理策略有助于对话系统有效地响应用户。对话管理中的策略学习是一项复杂的任务。为了建立一个目标导向的对话代理,过去的研究中,使用了不同的方法来训练有效的对话策略系统。生成对抗网络(GAN)由两个网络,生成器和鉴别器构成。生成器的主要作用是从真实数据生成虚假样本,侧重于策略学习过程的优化。鉴别器网络将接收来自策略学习训练得到的有效输出,并且将产生奖励。奖励输出可以是假或真,具体取决于0到1的值。GAN已经被应用于对话生成中,用来选择最佳策略以帮助构建对话代理。有效的对话策略学习可以提高对话管理的质量(流畅度和多样性)。而强化学习(RL)算法则用于优化策略策略,因为序列是离散的。在目前的研究中,我们提出了一种新技术,图生成对抗网络(CasGAN),将GCN和RL结合起来。Cas-GAN可以通过使用图卷积网络(GCN)来对序列之间的关系进行建模。该图由不同的高级和低级节点组成。我们使用最大对数似然(MLL)方法来优化参数,选择最佳节点。实验结果表明,我们所提的方法CasGAN比Seq-GAN更加有效。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP315;O157.5;TP18
本文编号:2605483
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP315;O157.5;TP18
【相似文献】
相关硕士学位论文 前1条
1 Nabeel Muhammad;Cas-GAN:一种基于GAN和强化学习的对话管理策略学习方法[D];华南理工大学;2019年
,本文编号:2605483
本文链接:https://www.wllwen.com/guanlilunwen/glzh/2605483.html