Cas-GAN:一种基于GAN和强化学习的对话管理策略学习方法

发布时间：2020-03-29 04:58

【摘要】：对话管理系统在日常生活中有广泛的应用,如在线购物,酒店预订和驾驶预订。在对话管理系统中,用户通过多轮对话与系统交互。有效的对话管理策略有助于对话系统有效地响应用户。对话管理中的策略学习是一项复杂的任务。为了建立一个目标导向的对话代理,过去的研究中,使用了不同的方法来训练有效的对话策略系统。生成对抗网络(GAN)由两个网络,生成器和鉴别器构成。生成器的主要作用是从真实数据生成虚假样本,侧重于策略学习过程的优化。鉴别器网络将接收来自策略学习训练得到的有效输出,并且将产生奖励。奖励输出可以是假或真,具体取决于0到1的值。GAN已经被应用于对话生成中,用来选择最佳策略以帮助构建对话代理。有效的对话策略学习可以提高对话管理的质量(流畅度和多样性)。而强化学习(RL)算法则用于优化策略策略,因为序列是离散的。在目前的研究中,我们提出了一种新技术,图生成对抗网络(CasGAN),将GCN和RL结合起来。Cas-GAN可以通过使用图卷积网络(GCN)来对序列之间的关系进行建模。该图由不同的高级和低级节点组成。我们使用最大对数似然(MLL)方法来优化参数,选择最佳节点。实验结果表明,我们所提的方法CasGAN比Seq-GAN更加有效。
【学位授予单位】：华南理工大学
【学位级别】：硕士
【学位授予年份】：2019
【分类号】：TP315;O157.5;TP18

【相似文献】