字符级神经网络机器翻译
发布时间:2021-10-31 22:33
*以下内容是根据英文摘要,经我们自己的神经网络机器翻译系统翻译而来。随着全球通信的增加,语言障碍成为一个亟待解决的问题。在目前的情况下,机器翻译是克服障碍的有效方法。机器翻译起源于17世纪,在19世纪后期作为统计机器翻译而发展起来。随着神经网络的发展和深度学习技术的发展,机器翻译也采用了这些技术,并取得了新的进展。神经机器翻译的目的是建立一个单一的神经网络,可以联合训练,最大限度地实现翻译性能。具有注意力的编码解码器结构实现了与现有的基于短语的系统相比的翻译性能。然而,大量词汇的使用已经成为神经机器翻译的瓶颈之一。例如,词级的神经机器翻译在捷克语言中表现更差。因为捷克语是斯拉夫语的语言,不仅有丰富而复杂的变化,而且具有丰富的形态学形态。为了更好地处理这些语言,我们提出了一种高效的字符级的神经机器翻译。介绍了一种分层编码器和层次解码器,构成了深层字符级的神经机器翻译(DCNMT)。分层编码器从编码字符序列开始,获得单词级表示,然后从单词级别学习语义特征。分层解码器在获得单词级别表示后,在字符级解码。这样一个深度的模型有两个主要的优点。它从根本上避免了大量词汇问题;同时,它比传统的基于字符...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
abstract
摘要
主要符号对照表
第一章 前言
1.1 统计机器翻译
1.2 神经网络机器翻译
1.3 词级、子词级与字符级模型
第二章 神经网络机器翻译
2.1 编码器-解码器架构
2.1.1 编码器
2.1.2 解码器
2.2 注意力机制
2.3 基本单元
2.3.1 词级模型
2.3.2 子词级模型
2.3.3 字符级模型
第三章 字符级神经网络机器翻译
3.1 现有模型
3.1.1 基于RNN的编码器
3.1.2 基于CNN的编码器
3.1.3 基于RNN的解码器
3.2 深度字符级神经网络机器翻译
3.2.1 分层编码器
3.2.2 分层解码器
3.3 通过注意机制再注意的神经网络机器翻译
3.3.1 字符级RNN
3.3.2 词级RNN
3.3.3 通过注意再注意机制
3.3.4 字符级解码器
第四章 数据获取和模型实现
4.1 数据准备
4.1.1 数据来源
4.1.2 数据预处理
4.2 模型细节
4.2.1 实现细节
4.2.2 复杂性分析
4.2.3 模型参数
4.2.4 训练细节
第五章 实验
5.1 定量分析
5.1.1 英法翻译
5.1.2 英捷翻译
5.1.3 英中翻译
5.1.4 语言相似性
5.2 定性分析
5.2.1 词表示和纠错能力
5.2.2 对字符级信息的利用
第六章 总结
参考文献
术语表
攻读学位期间发表的学术论文及译作
致谢
本文编号:3468983
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
abstract
摘要
主要符号对照表
第一章 前言
1.1 统计机器翻译
1.2 神经网络机器翻译
1.3 词级、子词级与字符级模型
第二章 神经网络机器翻译
2.1 编码器-解码器架构
2.1.1 编码器
2.1.2 解码器
2.2 注意力机制
2.3 基本单元
2.3.1 词级模型
2.3.2 子词级模型
2.3.3 字符级模型
第三章 字符级神经网络机器翻译
3.1 现有模型
3.1.1 基于RNN的编码器
3.1.2 基于CNN的编码器
3.1.3 基于RNN的解码器
3.2 深度字符级神经网络机器翻译
3.2.1 分层编码器
3.2.2 分层解码器
3.3 通过注意机制再注意的神经网络机器翻译
3.3.1 字符级RNN
3.3.2 词级RNN
3.3.3 通过注意再注意机制
3.3.4 字符级解码器
第四章 数据获取和模型实现
4.1 数据准备
4.1.1 数据来源
4.1.2 数据预处理
4.2 模型细节
4.2.1 实现细节
4.2.2 复杂性分析
4.2.3 模型参数
4.2.4 训练细节
第五章 实验
5.1 定量分析
5.1.1 英法翻译
5.1.2 英捷翻译
5.1.3 英中翻译
5.1.4 语言相似性
5.2 定性分析
5.2.1 词表示和纠错能力
5.2.2 对字符级信息的利用
第六章 总结
参考文献
术语表
攻读学位期间发表的学术论文及译作
致谢
本文编号:3468983
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3468983.html