当前位置:主页 > 文艺论文 > 语言艺术论文 >

基于知识迁移的机器翻译质量评估方法研究

发布时间:2020-10-28 09:51
   随着当今社会经济文化科技的快速发展,机器翻译技术作为连接不同语言之间的桥梁变得至关重要。对于机器翻译系统产生的翻译结果,需要用量化的评判标准评价其翻译质量,这就是机器翻译评测。机器翻译评测已经成为了机器翻译领域一个被广泛研究和讨论的问题。机器翻译质量评估是给定机器翻译系统的源端句子和翻译结果,在不依赖参考译文的情况下,对翻译结果的质量进行评估的机器翻译评测方法。传统的机器翻译质量评估方法通过人工设计的语言学特征等来反映翻译结果的质量,但依赖于语言本身、以及特定的语言学资源和工具。最初引入深度学习技术的机器翻译质量评估方法利用建模能力更强的神经网络模型学习词向量特征、语言模型特征等,但这些特征仍需要人工事先定义好。而目前流行的基于“预测器-评估器”架构的机器翻译质量评估方法,首先使用预测器借助大规模的双语平行语料和机器翻译模型自动学习高维特征表示,然后使用评估器基于学习到的特征进行翻译质量评估。这种方法不需要人工设计特征,同时可以将单向翻译任务中的翻译知识迁移到质量评估任务中。但是该方法只迁移了单向的翻译知识,这使得质量评估模型不能充分建模出源端句子和翻译结果之间互为翻译的关系;而且预测器和评估器是使用平行语料和质量评估任务的数据分开训练的,这使得预测器学习到的特征向量表示并不一定完全适用于质量评估任务本身;此外,一些低资源语言对双语平行语料有限,无法有效对这种需要大规模平行语料的质量评估模型建模,这使得模型具有一定的应用局限性。本文的工作主要在基于“预测器-评估器”架构的机器翻译质量评估方法的研究背景下,探究如何有效地将可用知识迁移到机器翻译质量评估任务中。针对上述问题,本文的主要工作如下:1.为加强源端句子和翻译结果之间的翻译关系,本文提出了一种融合双向翻译知识的机器翻译质量评估模型。一方面,通过使用两个语向的机器翻译模型,可以起到互相监督的作用,自动学习到信息量更加丰富的有效特征表示;另一方面,通过结合双语向机器翻译模型与质量评估模型,可以将双向翻译任务中的翻译知识迁移到质量评估任务中,建模源端句子和翻译结果之间双向的翻译关系,增强整个机器翻译质量评估模型的表示能力。此外,为了得到更适用于质量评估任务的特征,本文将联合学习的训练方法应用到机器翻译质量评估模型中,使得预测器自动学习到的特征表示更加适用于质量评估任务本身。2.针对低资源语言对平行语料有限,无法有效对模型建模的问题,本文提出了一种融合单语知识的机器翻译质量评估模型,将更易获取的单语语料和目前效果最好的表示学习模型应用到质量评估任务中。这种通过单语语料预训练好的表示学习模型,可以建模源端句子和翻译结果之间的语义关系,并将大规模的单语知识迁移到质量评估任务中,辅助质量评估模型取得更好的模型性能。本文在WMT 2017英德语向的机器翻译质量评估任务数据集上进行实验,实验结果证明了本文提出的机器翻译质量评估模型的有效性,而且可以达到并超过目前最好的质量评估模型。
【学位单位】:南京大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:H085
【部分图文】:

基于知识迁移的机器翻译质量评估方法研究


图2-1:引入注意力机制的基于循环神经网络的神经机器翻译模型的基本结构??中,&表示源端语言的词汇表大小

机器翻译,神经,基本结构,循环神经网络


循环神经网络基础上的神经机器翻译模型只能从左向右或者从右向。这种机制就带来了两个问题,首先是t时刻的状态计算依赖于t-i算结果,这样限制了模型的并行能力;其次是顺序计算的过程中信即长距离依赖问题。虽然很多工作通过使用GRU或者LSTM等门机可以在一定程度上缓解长距离依赖的问题,但是对于特别长距离的依基于循环神经网络的神经机器翻译模型还是无法很好地解决。??基于此,Googlet50】提出一种全新架构的神经机器翻译模型,抛弃传环神经网络的架构,而只使用注意力机制来解决上述提到的两个问过自注意力机制,来计算任意两个位置上的输入之间的关系,可以依赖问题;其次它不是循环神经网络那样的顺序结构,因此具有良好,也更加符合图形处理器(Graphics?Processing?Unit,?GPU)的设计桐

质量评估,机器翻译,模型结构,向量表示


.3融合双向翻译知识的机器翻译质量评估模型?29??提取模块和质量评估模块。其中,特征提取模块由两个对称的词预测子模块组??成,即源端语言到目标端语言语向的词预测子模块和目标端语言到源端语言语??向的反向词预测子模块,分别用来抽取待评估的系统输出译文中每个单词对应??的特征向量表示,以及源端句子中每个单词对应的特征向量表示。质量评估模??块由两个相同结构的双向循环神经网络组成,分别将源端句子中每个单词对??应的特征向量表示和系统输出译文中每个单词对应的特征向量表示压缩成固??定维度的特征向量表示,用来衡量源端句子的“质量”和系统输出译文的“质??”,然后将源端的向量表示和目标端的向量表示拼接起来,通过一个全连接??的参数矩阵可以得到一个实数值,最后通过S形函数将得到的实数值限定在??0,1]之间,即为预测的HTER值。在这里进行限定操作的原因是机器翻译质量??估任务中规定质量标签HTER的值在[0,1]之间。接下来的部分将对特征提取??模块和质量评估模块的具体结构进行详细介绍。??HTER??
【相似文献】

相关期刊论文 前10条

1 张长明;;《翻译质量评估:过去与现在》评介[J];广东石油化工学院学报;2016年05期

2 王少爽;;翻译质量研究的新视角——《职业化翻译中的质量:评估与改进》述评[J];外国语(上海外国语大学学报);2017年01期

3 周忠良;;翻转教学模式下学生翻译质量的频次效应研究[J];襄阳职业技术学院学报;2017年05期

4 林佩璇;谢朝群;;从豪斯翻译质量评估综合模式看翻译研究的未来走向[J];湖南科技大学学报(社会科学版);2016年04期

5 李亚锋;;英语笔译中的常见误区及对策探讨[J];校园英语;2017年15期

6 温亭亭;吴步青;;影响翻译质量的因素[J];北方文学;2017年23期

7 邵鑫鑫;张阿林;;标识翻译质量与城市语言生态环境建设关系探微[J];长江丛刊;2017年31期

8 崔嫣嬝;;中外翻译质量评估模式研究[J];青年文学家;2014年32期

9 何三宁;;并列还是从属:翻译质量评估与翻译批评之关系[J];南昌大学学报(人文社会科学版);2009年04期

10 张霄军;;翻译质量量化评价研究综述[J];外语研究;2007年04期


相关博士学位论文 前3条

1 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年

2 魏清光;改革开放以来我国翻译活动的社会运行研究[D];华东师范大学;2012年

3 项东;工商管理教材汉译策略研究[D];复旦大学;2009年


相关硕士学位论文 前10条

1 侯琦;基于知识迁移的机器翻译质量评估方法研究[D];南京大学;2019年

2 廖昕;司显柱翻译质量评估模式下政府网站新闻翻译研究[D];北京交通大学;2018年

3 Zhang Jia;[D];西安外国语大学;2018年

4 张慧;《中华人民共和国民法总则》的翻译质量评估:信息桥论视角[D];广东外语外贸大学;2018年

5 Li Jiaojiao;环球网财经新闻翻译质量自我评估实践报告[D];西安外国语大学;2017年

6 吴怡洁;《翻译质量评估:历史与现状》(第1-2章)翻译实践报告[D];新疆师范大学;2017年

7 蔡银;基于动态翻译质量框架模式的翻译项目质量评估研究[D];湖南农业大学;2016年

8 段春景;《职业翻译质量:评估与改善》(简介和第一章)翻译报告[D];四川外国语大学;2015年

9 李文芳;建立在“信、达、雅”基础上的翻译质量评估新模式[D];湖南工业大学;2012年

10 肖群;构建翻译质量评估的优选论分析模式[D];中南大学;2010年



本文编号:2859928

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/2859928.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47939***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com