基于单语语料库训练的蒙汉机器翻译的研究
发布时间:2023-11-08 18:24
机器翻译是人工智能领域的重要研究课题之一,主要目标是研究如何使用计算机实现一种自然语言到另一种自然语言的自动转换。随着互联网的不断发展和研究方法的不断改进,机器翻译性能也随之不断提高。虽然从目前的研究现状来看,神经机器翻译在资源丰富且有大规模高质量广覆盖面的平行语料的语种上取得了很好的翻译效果,但是在平行语料稀少的语种上却表现不佳。然而作为一种数据驱动的方法,只有当训练语料库达到一定的要求,其才会体现出较好的翻译效果,而少数民族地区经济文化发展普遍相对缓慢,可以收集到的平行语料资源相对较少。在这种情况下,神经机器翻译很难取得理想的效果。因此,为了充分利用现有单语数据提高蒙汉机器翻译系统的性能,本文进行了基于单语语料库训练的蒙汉机器翻译的研究。首先,针对蒙汉机器翻译中平行语料资源稀缺的问题,总结出实现基于单语语料库训练的三大原则:预训练语言模型、初始化翻译模型和迭代回译优化初始翻译模型。并就三大原则中的第一条进行了深入的研究,发现基于多头自注意力机制融合蒙汉单语和双语语料预训练跨蒙汉语言模型能够在很大程度上提升翻译模型的性能。其次,另外一个工作是对语料进行融合不同粒度的切分比较。蒙古文词...
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究目的及意义
1.3 国内外研究现状
1.4 研究内容
1.5 组织结构
第二章 相关技术与理论概述
2.1 神经机器翻译
2.2 基于单语语料库训练的神经机器翻译
2.2.1 半监督神经机器翻译
2.2.2 无监督神经机器翻译
2.3 评测方法
2.4 本章小节
第三章 融合不同粒度的语料切分的研究
3.1 词级粒度
3.1.1 基于条件随机场分词
3.1.2 实验设置和结果分析
3.1.3 融合双向LSTM和 CRF(Bi-LSTM-CRF)模型分词
3.1.4 实验设置和结果分析
3.2 子词级粒度
3.2.1 字节对编码
3.2.2 实验设置和结果分析
3.3 融合不同粒度
3.3.1 融合词级粒度和子词级粒度
3.3.2 实验设置和结果分析
3.4 本章小结
第四章 基于单语语料库训练的研究
4.1 跨语言词嵌入表示
4.2 构造蒙汉双语字典
4.2.1 最近邻搜索
4.2.2 生成式对抗训练
4.3 蒙汉机器翻译
4.3.1 训练蒙汉语言模型
4.3.2 初始化蒙汉机器翻译模型
4.3.3 迭代回译
4.4 实验设置
4.5 实验结果
4.5.1 跨语言词嵌入
4.5.2 蒙汉翻译模型
4.6 基于LSTM神经网络的蒙汉机器翻译模型
4.6.1 基于LSTM的神经网络模型
4.6.2 实验过程
4.7 实验分析
4.8 本章小结
第五章 预训练跨蒙汉语言模型的研究
5.1 语言模型及预训练
5.2 基于多头自注意力机制的研究
5.2.1 基于多头自注意力机制框架的构建
5.2.2 实验设置
5.2.3 实验结果
5.3 基于预训练语言模型的蒙汉机器翻译
5.3.1 实验设置
5.3.2 实验结果
5.4 平行语料改进预训练语言模型
5.5 实验结论与分析
5.6 本章小结
结论
参考文献
致谢
攻读硕士学位期间发表的学术论文及研究成果
本文编号:3861502
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究目的及意义
1.3 国内外研究现状
1.4 研究内容
1.5 组织结构
第二章 相关技术与理论概述
2.1 神经机器翻译
2.2 基于单语语料库训练的神经机器翻译
2.2.1 半监督神经机器翻译
2.2.2 无监督神经机器翻译
2.3 评测方法
2.4 本章小节
第三章 融合不同粒度的语料切分的研究
3.1 词级粒度
3.1.1 基于条件随机场分词
3.1.2 实验设置和结果分析
3.1.3 融合双向LSTM和 CRF(Bi-LSTM-CRF)模型分词
3.1.4 实验设置和结果分析
3.2 子词级粒度
3.2.1 字节对编码
3.2.2 实验设置和结果分析
3.3 融合不同粒度
3.3.1 融合词级粒度和子词级粒度
3.3.2 实验设置和结果分析
3.4 本章小结
第四章 基于单语语料库训练的研究
4.1 跨语言词嵌入表示
4.2 构造蒙汉双语字典
4.2.1 最近邻搜索
4.2.2 生成式对抗训练
4.3 蒙汉机器翻译
4.3.1 训练蒙汉语言模型
4.3.2 初始化蒙汉机器翻译模型
4.3.3 迭代回译
4.4 实验设置
4.5 实验结果
4.5.1 跨语言词嵌入
4.5.2 蒙汉翻译模型
4.6 基于LSTM神经网络的蒙汉机器翻译模型
4.6.1 基于LSTM的神经网络模型
4.6.2 实验过程
4.7 实验分析
4.8 本章小结
第五章 预训练跨蒙汉语言模型的研究
5.1 语言模型及预训练
5.2 基于多头自注意力机制的研究
5.2.1 基于多头自注意力机制框架的构建
5.2.2 实验设置
5.2.3 实验结果
5.3 基于预训练语言模型的蒙汉机器翻译
5.3.1 实验设置
5.3.2 实验结果
5.4 平行语料改进预训练语言模型
5.5 实验结论与分析
5.6 本章小结
结论
参考文献
致谢
攻读硕士学位期间发表的学术论文及研究成果
本文编号:3861502
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3861502.html