基于强化学习的蒙汉神经网络机器翻译的研究

发布时间:2022-01-21 07:02
  近年来,借助深度学习的飞速发展,神经网络机器翻译的研究取得了非常显著的进展。蒙汉机器翻译的研究起步较晚,平行语料规模相对较小,存在严重的数据稀疏问题。本论文将从两个方面展开研究:一、模型损失函数和译文评价指标度量方式不一致,模型训练阶段依赖真实数据分布而预测阶段依赖模型分布从而导致曝光偏差问题产生。本文引入强化学习的思想,利用不同奖励机制解决损失函数和评价指标度量方式不一致问题,通过不同的解码方式缓解曝光偏差问题;二、数据稀疏条件下模型训练困难。本文提出了一种利用蒙古语子词向量对翻译模型参数初始化的方法,并提出了一种随机添加噪声数据的数据增强方法用于增强蒙汉双语数据。具体方法如下:一、尝试在蒙汉神经网络机器翻译任务中引入强化学习的思想。设置不同级别(词语级、序列级)的奖励函数,并以不同比例线性结合奖励函数和交叉熵损失函数进行实验。实验在40%序列级奖励+60%交叉熵损失函数的设置上得到最优结果。本文还对束搜索、计划采样等解码方法进行对比,实验证明计划采样这一方法取得了更好的效果。二、提出了一种基于子词粒度的蒙古语词向量生成方法。该方法借助BPE切分算法,在大规模单语语料上生成与平行语料... 

【文章来源】:内蒙古大学内蒙古自治区 211工程院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于强化学习的蒙汉神经网络机器翻译的研究


词嵌入降维表示Figure3-3Thereduceddimensionrepresentationofwordembedding如图3-3所示,图中红色点为实验采样代词的词向量降维表示,黑点为其余词的词向量

序列,损失函数


基于强化学习的蒙汉神经网络机器翻译的研究36确词语,从而使得误差从序列的起始就产生累积,词语级奖励在训练开始阶段出现大量为0的情况。在没有其他条件对模型进行指引的情况下,词语级奖励可能更加迟缓了模型的收敛,进而导致模型质量变差。上述实验结果的BLEU值降低可能来自于训练的起始阶段,强化学习的奖励函数无法指引模型更快地向最优点附近收敛。为进一步研究设置奖励是否真的不会为蒙汉机器翻译模型带来性能提升,第二部分的实验尝试缓解奖励稀疏的问题,利用结合后的损失函数进行实验。我们以=[0,0.2,0.4,0.6,0.8,1]的权重结合交叉熵损失函数和序列级奖励函数,其中=0时,表示损失函数为完全使用奖励函数,=1时,表示损失函数完全使用交叉熵,实验结果如图所示。图4-1结合损失函数的实验结果Figure4-1Theexperimentresultscombiningdifferentlossfunction实验结果表明,当=0.4时,翻译模型的预测结果可以得到最为优秀的BLEU值,超过了完全使用交叉熵损失函数的基线模型(+0.27)。实验结果证明强化学习奖励函数的引入,确实为蒙汉机器翻译带来了性能的提升。完全使用奖励函数训练的模型会严重影响模型的收敛,而与交叉熵损失函数的结合可以在训练的初始阶段稳定训练过程,提升模型质量。4.4.3针对探索利用问题的实验结果与分析除了损失函数对模型带来的影响,模型的解码过程实际上对于曝光偏差的影响更大。本小节对探索-利用问题的不同考虑进行了对比实验,实验在上一节最优(使用最终奖励,=0.4)的配置下进行,实验结果如下表所示。

【参考文献】:
期刊论文
[1]机器翻译发展与现状[J]. 黎亚飞,张瑞华.  中国轻工教育. 2019(05)
[2]神经机器翻译综述[J]. 高明虎,于志强.  云南民族大学学报(自然科学版). 2019(01)
[3]子字粒度切分在蒙汉神经机器翻译中的应用[J]. 任众,侯宏旭,吉亚图,武子玉,白天罡,雷颖.  中文信息学报. 2019(01)
[4]神经机器翻译综述[J]. 李亚超,熊德意,张民.  计算机学报. 2018(12)
[5]基于数据增强技术的神经机器翻译[J]. 蔡子龙,杨明明,熊德意.  中文信息学报. 2018(07)
[6]神经机器翻译前沿进展[J]. 刘洋.  计算机研究与发展. 2017(06)
[7]语言保护与中国的少数民族语言[J]. 戴庆厦.  民俗典籍文字研究. 2016(02)
[8]机器翻译技术现状与展望[J]. 刘群.  集成技术. 2012(01)
[9]基于实例的汉蒙机器翻译[J]. 侯宏旭,刘群,那顺乌日图.  中文信息学报. 2007(04)
[10]统计机器翻译综述[J]. 刘群.  中文信息学报. 2003(04)

博士论文
[1]多方法融合蒙汉机器翻译与译文重排序研究[D]. 武静.内蒙古大学 2017

硕士论文
[1]融合先验信息的蒙汉神经网络机器翻译模型[D]. 樊文婷.内蒙古大学 2018
[2]融合离散词概率信息的蒙汉神经机器翻译[D]. 李金廷.内蒙古大学 2018
[3]多粒度蒙古文汉文神经网络机器翻译研究[D]. 王洪彬.内蒙古大学 2018
[4]基于注意力神经网络的蒙汉机器翻译系统的研究[D]. 申志鹏.内蒙古大学 2017
[5]基于层次短语模型的蒙—汉统计机器翻译研究[D]. 苏传捷.内蒙古大学 2014



本文编号:3599793

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3599793.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户86d93***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com