当前位置:主页 > 文艺论文 > 汉语言论文 >

基于质量估计的神经自动后编辑方法研究

发布时间:2021-05-22 18:51
  近年来,随着深度学习在机器翻译领域的成功应用和深入研究,与之相应的译文自动后编辑方法也由传统统计模型转向深度学习模型,如何将神经机器翻译模型有效地利用到译文后编辑领域,成为机器翻译相关的研究热点之一。自动后编辑中存在的一个普遍问题是过度修正,即在译文在后编辑过程中被修改的程度超过了实际需要而引起译文质量下降的情况。对于这个问题,现有的方法一般通过在训练数据中增加原始机器译文与人工后编辑译文相同的特殊训练集,或是在候选译文排序过程中添加惩罚因子以约束后编辑系统对机器译文的修改程度。但是这类做法很难同时兼顾系统的性能且减少过度修正。针对现有方法存在的这些不足,本文提出基于翻译质量估计的神经自动后编辑方法。我们首先使用TER脚本对后编辑过程中易出现过度修正的原始机器译文所需的编辑次数和类型进行统计,并使用Zipf拟合统计结果加以分析;然后依据分析结果将原始机器译文分类,对各类译文分别建立神经自动后编辑子模型;最后利用机器翻译质量估计方法建立候选译文的分层排序方法将子模型联合。为了验证本文所提方法的性能,我们在WMT’16、WMT’17机器翻译自动后编辑评测任务上进行了充分的实验验证,实验结果... 

【文章来源】:江西师范大学江西省

【文章页数】:51 页

【学位级别】:硕士

【文章目录】:
中文摘要
英文摘要
1 引言
    1.1 研究背景及意义
    1.2 相关工作研究现状
        1.2.1 统计译文自动后编辑方法
        1.2.2 神经译文自动后编辑方法
    1.3 本文主要工作及内容
    1.4 文章组织结构
2 关键方法介绍
    2.1 基于神经网络的机器翻译方法
        2.1.1 基于RNN的Encoder-Decoder模型
        2.1.2 带注意力机制的双向RNN Encoder-Decoder模型
    2.2 机器翻译质量估计方法
        2.2.1 基于特征工程的质量估计方法
        2.2.2 基于神经网络的质量估计方法
    2.3 本章小结
3 基于质量估计的神经译文自动后编辑方法
    3.1 研究动机
    3.2 无效/过度修正现象分析
    3.3 语料分类与模型设计
    3.4 基于质量估计的译文分层排序方法
    3.5 本章小结
4 实验
    4.1 实验设置
        4.1.1 实验数据
        4.1.2 参数设置
    4.2 实验结果
    4.3 本章小结
5 实验分析
    5.1 定性对比分析
        5.1.1 WMT'16,WMT'17 APE英译德子任务定性分析
        5.1.2 WMT'17 APE德译英子任务定性分析
    5.2 定量对比分析
        5.2.1 WMT'16,WMT'17 APE英译德子任务定量分析
        5.2.2 WMT'17 APE德译英子任务定量分析
    5.3 WMT'17 APE德译英子任务问题分析
6 总结与展望
参考文献
致谢
在读期间公开发表论文


【参考文献】:
期刊论文
[1]基于神经网络特征的句子级别译文质量估计[J]. 陈志明,李茂西,王明文.  计算机研究与发展. 2017(08)
[2]基于句法的统计机器翻译模型与方法[J]. 刘群.  中文信息学报. 2011(06)



本文编号:3201500

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/3201500.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e59d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com