基于参考译文图的机器翻译质量评价方法研究
本文选题:机器翻译 切入点:自动评价 出处:《南京大学》2017年硕士论文
【摘要】:随着科技日新月异的发展,机器翻译技术得到了越来越多人的关注,其理论研究以及实际应用都已成为机器学习领域的一大热点。与人工翻译相比,机器翻译在翻译效率上有较明显的提高,且代价较低,所以自动化翻译技术(机器翻译技术)的研究已经成为一个非常重要的研究方向。随着机器翻译技术的飞速发展,机器翻译质量评价这一研究课题应运而生,对于机器翻译系统产生的翻译结果,我们需要衡量其翻译质量如何。完成机器翻译本身并不是最终目的,我们希望知道机器译文能够在多大程度上帮助到人们,同时,对机器译文质量有大致的评估,也有助于学习得到一个更好的机器翻译系统,这两者相辅相成。对于机器译文的评测,传统的方式是进行人工评价,但是这种方式由于其耗时、代价昂贵且结果不可重现,现已被自动评测方法部分取代。当前主流的自动评测方法,采用的都是相同的策略:将机器译文与一个或是多个人工译文(参考译文)进行比较,并且认为一个与参考译文非常相似的机器译文肯定比那些与参考译文有较大差异的译文更准确。但是,由于语义和表达方式的多样性,源语言中的一个句子可能有很多不同的正确翻译结果(即翻译多样性),而参考译文是有限的,这就会导致在一些情况下,自动评测方法不能准确的对译文质量有一个评估,同时这一问题也限制了机器翻译系统的翻译能力。在本文中,我们针对目前的自动评测方法在翻译多样性方面的的缺陷做出了改进。由于人工翻译的昂贵代价,我们能够获取到的参考译文是有限的,因此,本文提出了一种从有限的资源中获取到更多信息的自动方法。首先,我们探索了不同的评价方法以及选择不同的参考译文对机器翻译系统的影响;其次,对已有的参考译文进行拓展,对于部分存在多个参考译文的数据集,通过构建一个参考译文图以获取更多的信息,对于大部分只存在一个参考译文的数据集,利用外部单语资源英文复述表,对当前的参考译文进行拓展,得到一个含有更加丰富信息的参考译文图;最后,通过从参考译文图中寻找最优路径以提高效率,并将该自动方法应用到已有的自动评测方法中,帮助提升机器翻译系统本身的翻译能力。实验结果表明,本文提出的从有限的资源中获取到更多信息的自动方法能够更快地获取到更加丰富且多样的参考译文信息。对于多个参考译文的拓展,能够对机器译文作出更加准确的评价;对于单个参考译文的拓展,不仅能够更准确地评价系统译文,同时还减小了使用不同译文带来的系统性能的差异;将该方法应用于翻译系统的训练过程,有效的提高了翻译系统能力。
[Abstract]:With the rapid development of science and technology, machine translation technology has been paid more and more attention. Its theoretical research and practical application have become a hot spot in the field of machine learning. The efficiency of machine translation has been improved obviously and the cost is low. Therefore, the research of automatic translation technology (machine translation technology) has become a very important research direction. With the rapid development of machine translation technology, The quality evaluation of machine translation has come into being. We need to measure the translation quality of the machine translation system, and it is not the ultimate goal to complete the machine translation. We want to know how much machine translation can help people, and at the same time, to have a general assessment of the quality of machine translation, and to learn about a better machine translation system. The traditional method of evaluating machine translations is manual evaluation, but because of its time-consuming, expensive and unrepeatable results, Has been partially replaced by automated evaluation methods. The current mainstream automated evaluation methods use the same strategy: compare machine translations to one or more manual translations (reference translations), And think that a machine translation that is very similar to the reference translation is certainly more accurate than those that differ greatly from the reference translation. However, due to the diversity of semantics and expressions, A sentence in the source language may have many different correct translation results (i.e., translation diversity, and the reference translation is limited, which can lead in some cases to an accurate assessment of the quality of the translation by automatic evaluation methods. At the same time, this problem also limits the translation ability of machine translation systems. In this paper, we make improvements to the shortcomings of the current automated evaluation methods in terms of translation diversity. The number of reference translations we can obtain is limited, so this paper proposes an automatic method for obtaining more information from limited resources. We explore the influence of different evaluation methods and the selection of different reference translations on the machine translation system. Secondly, we extend the existing reference translations to some data sets with multiple reference translations. By constructing a reference translation map to obtain more information, for most of the data sets where there is only one reference translation, the current reference translation can be extended by using the external monolingual resource English retelling table. A reference translation map with more information is obtained. Finally, by searching for the optimal path from the reference translation map to improve efficiency, the automatic method is applied to the existing automatic evaluation methods. Help to improve the translation capabilities of the machine translation system itself. The automatic method of obtaining more information from limited resources in this paper can obtain more abundant and diverse reference translation information more quickly. For the expansion of multiple reference translations, the machine translation can be evaluated more accurately. For the expansion of a single reference translation, it can not only evaluate the system translation more accurately, but also reduce the system performance difference caused by using different translation, and apply this method to the training process of translation system. Effectively improve the translation system ability.
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:H085
【相似文献】
相关期刊论文 前10条
1 吴倩;谢旭升;;译文质量与译者传统角色的颠覆[J];伊犁师范学院学报(社会科学版);2011年02期
2 肖安法;;论译文质量的检验[J];常州工学院学报(社科版);2013年04期
3 徐盛桓;译文质量评估的数学模型[J];华南师范大学学报(社会科学版);1987年04期
4 热外都拉,李培环;对一些译文的意见[J];语言与翻译;1989年01期
5 李立达;谈“雅”及译文的“雅”处理[J];内江师范学院学报;1990年01期
6 曾谢岩;谈谈国际会议通知的译文质量[J];中国科技翻译;1993年02期
7 刘宪军;地方外宣资料译文质量亟待提高[J];中国科技翻译;1998年02期
8 姚雪梅;;文学译文的翻译策略分析:如何关照译文的读者[J];芒种;2012年13期
9 刘精香;一篇珠圆玉润的译文——浅评How to Mark a Book的汉译[J];大学英语;1993年04期
10 韩子满;过犹不及——浅论译文的归化问题[J];外语教学;2000年02期
相关会议论文 前9条
1 叶立林;;译文质量的主观评价[A];贵州省翻译工作者协会第6届会员代表大会暨2007年翻译学术年会论文集[C];2007年
2 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
3 朱宪超;;十年翻译路(2000-2010)——谈谈我对翻译工作的几点认识[A];全国首届翻译硕士(MTI)教育与翻译产业研讨会论文集[C];2009年
4 周玲;;理解对译者意味着什么[A];国际交流学院科研论文集(第四期)[C];1997年
5 董振东;董强;;机译研究中的一些误区——从译文质量分析看[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 陈绛;;评《中国的现代化》的名词翻译——兼及若干译本的译名问题[A];近代中国(第二辑)[C];1991年
7 陈可;;论高语速语境下中英同传的简约处理[A];中国翻译学学科建设高层论坛摘要[C];2013年
8 张霄军;杨云峰;;英语否定句的四种机译质量评析[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
9 靳宁;贾德江;;再论关联理论对翻译的解释力[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
相关重要报纸文章 前9条
1 冯威;译著质量:一个死角?[N];中国新闻出版报;2005年
2 林晓琴 福建师范大学外国语学院;生态翻译学:“三位一体”,译者主导[N];中国社会科学报;2012年
3 蒋一帆;邮集翻译的质量标准[N];中国集邮报;2009年
4 张卫族;《杰克·韦尔奇自传》翻译硬伤多得令人忧虑[N];中国新闻出版报;2003年
5 王鸣阳;谈科技翻译质量[N];中华读书报;2002年
6 本报记者 田小满;学者解析当下学术翻译症结[N];中国社会科学报;2011年
7 葛崇岳;也说文学翻译信、达、雅[N];安徽日报;2004年
8 勿罔;翻译大奖外行胜内行[N];中华读书报;2001年
9 林会敏(书评人);译海里的夜行灯塔[N];中国图书商报;2006年
相关硕士学位论文 前10条
1 徐娟;“南京市电子地图地名翻译”项目审校报告[D];南京理工大学;2015年
2 王淼;传播学视角下的《易经》翻译研究[D];华北电力大学;2015年
3 梁瑾璇;汉语博物馆文本英译问题及其对策研究[D];山西大学;2015年
4 奎地;论计算机辅助译文质量控制[D];青岛科技大学;2016年
5 丁国庆;视点转换手法在《鹿王》视译实践中的运用[D];吉林大学;2016年
6 林新靖;英语节奏视角下的汉英笔译效果研究[D];北京外国语大学;2016年
7 徐梦云;汉英同传中脱离源语语言外壳对译文质量的影响[D];北京外国语大学;2016年
8 马瑞雪;不同耳机佩戴方式对英汉同传质量影响的比较研究[D];北京外国语大学;2016年
9 李莹;论发言人部分脱稿对英中带稿和无稿同传的影响[D];北京外国语大学;2016年
10 王威;融合检索技术的译文推荐系统的研究与实现[D];北京工业大学;2016年
,本文编号:1662246
本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/1662246.html