基于中轴语的统计机器翻译研究
发布时间:2022-02-15 16:29
机器翻译是指利用计算机自动的将一种自然语言翻译为另一种自然语言的技术。近年来,统计机器翻译与神经网络机器翻译已成为机器翻译研究领域的主流。统计机器翻译与神经网络机器翻译的基本思想是利用学习算法,从大规模双语句对中学习到翻译规则。但是,并不是所有的语言对之间都存在大规模的双语句对。为了解决机器翻译中的数据稀疏问题,研究人员提出了中轴语的概念,即在源语言与目标语中间引入中轴语,要求源语言与中轴语、中轴语与目标语之间存在大规模双语语料。本文针对基于中轴语的统计机器翻译,重点研究以下几个方面:1.中轴语翻译的概率估计。目前,主流的中轴语翻译研究建立在基于短语的统计机器翻译基础上,这些研究通过直接将源语言-中轴语、中轴语-目标语的翻译概率相乘得到源语言-目标语的翻译概率。然而,由于源语言-中轴语、中轴语-目标语分布于两个不同的概率空间,并且可能存在着领域差异,这会导致翻译概率准确率低。为此,本文提出基于短语对共现次数的中轴语短语翻译模型,该方法首先抽取源语言-中轴语、中轴语-目标语短语,然后基于上述短语对推导出相应的源语言-目标语短语,最后在推导出的源语言-目标语短语对基础上计算源语言-目标语短...
【文章来源】:哈尔滨工业大学黑龙江省211工程院校985工程院校
【文章页数】:125 页
【学位级别】:博士
【部分图文】:
不同损失函数的比较
【参考文献】:
期刊论文
[1]神经机器翻译综述[J]. 李亚超,熊德意,张民. 计算机学报. 2018(12)
[2]基于数据增强技术的神经机器翻译[J]. 蔡子龙,杨明明,熊德意. 中文信息学报. 2018(07)
[3]基于约束的神经机器翻译[J]. 熊德意,李军辉,王星,张飚. 中国科学:信息科学. 2018(05)
[4]基于Transfer和Triangulation融合的中介语统计机器翻译方法[J]. 王强,杜权,肖桐,朱靖波. 中文信息学报. 2017(04)
[5]神经机器翻译前沿进展[J]. 刘洋. 计算机研究与发展. 2017(06)
[6]稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究[J]. 李强,王强,肖桐,朱靖波. 计算机学报. 2017(04)
[7]互联网机器翻译[J]. 王海峰,吴华,刘占一. 中文信息学报. 2011(06)
[8]统计机器翻译综述[J]. 刘群. 中文信息学报. 2003(04)
硕士论文
[1]融合多语编码信息的神经机器翻译研究[D]. 刘笛.哈尔滨工业大学 2017
[2]基于三语平行语料的语义向量的机器翻译研究[D]. 王晓雪.哈尔滨工业大学 2016
本文编号:3626954
【文章来源】:哈尔滨工业大学黑龙江省211工程院校985工程院校
【文章页数】:125 页
【学位级别】:博士
【部分图文】:
不同损失函数的比较
【参考文献】:
期刊论文
[1]神经机器翻译综述[J]. 李亚超,熊德意,张民. 计算机学报. 2018(12)
[2]基于数据增强技术的神经机器翻译[J]. 蔡子龙,杨明明,熊德意. 中文信息学报. 2018(07)
[3]基于约束的神经机器翻译[J]. 熊德意,李军辉,王星,张飚. 中国科学:信息科学. 2018(05)
[4]基于Transfer和Triangulation融合的中介语统计机器翻译方法[J]. 王强,杜权,肖桐,朱靖波. 中文信息学报. 2017(04)
[5]神经机器翻译前沿进展[J]. 刘洋. 计算机研究与发展. 2017(06)
[6]稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究[J]. 李强,王强,肖桐,朱靖波. 计算机学报. 2017(04)
[7]互联网机器翻译[J]. 王海峰,吴华,刘占一. 中文信息学报. 2011(06)
[8]统计机器翻译综述[J]. 刘群. 中文信息学报. 2003(04)
硕士论文
[1]融合多语编码信息的神经机器翻译研究[D]. 刘笛.哈尔滨工业大学 2017
[2]基于三语平行语料的语义向量的机器翻译研究[D]. 王晓雪.哈尔滨工业大学 2016
本文编号:3626954
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3626954.html
最近更新
教材专著