融合被动和可能态模型的日汉统计机器翻译
发布时间:2017-08-17 03:20
本文关键词:融合被动和可能态模型的日汉统计机器翻译
【摘要】:日语中谓词语态有不同的词尾变形,其中被动态和可能态具有相同的词尾变化,在统计机器翻译中难以对其正确区分及翻译。因此,该文提出一种利用最大熵模型有效地对日语可能态和被动态进行分类,然后把日语的可能态和被动态特征有效地融合到对数线性模型中改进翻译模型的方法,以提高可能态和被动态翻译规则选择的准确性。实验结果表明,该方法可以有效提升日语可能态和被动态句子的翻译质量,在大规模日汉语料上,最高翻译BLEU值能够由41.50提高到42.01,并在人工评测中,翻译结果的整体可理解度得到了2.71%的提升。
【作者单位】: 北京交通大学计算与信息技术学院;
【关键词】: 被动态 可能态 统计机器翻译 最大熵模型
【基金】:国家自然科学基金(61370130;61473294) 中央高校基本科研业务费专项资金资助(2015JBM033) 国家国际科技合作专项资助(2014DFA11350)
【分类号】:TP391.2
【正文快照】: 1引言日语的“态”是一种语言现象,指在谓语后加接尾辞,且补充语的格规则也相应发生变化的情况。被动态与可能态是日语语态中的两种典型形式。表示主体受到另一事物的动作时使用动词的被动态,而在表示主体具有某种能力、有条件进行某种行为时,使用动词的可能态。这两种语态多,
本文编号:686892
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/686892.html