当前位置:主页 > 文艺论文 > 汉语言论文 >

基于端到端神经网络的蒙汉机器翻译的研究

发布时间:2021-01-10 03:23
  随着自然语言处理和机器翻译技术的发展,利用人工智能技术来提高不同语言间的翻译效率和准确率逐渐成为了研究热点。其中,端到端(End to End,E2E)神经网络模型结构的神经机器翻译方法由于翻译准确率高、译文语义性强等优点逐渐成为研究的重点,但依然存在词汇受限、译文忠实度低等问题。为了解决端到端神经机器翻译中存在的上述问题,本文围绕机器翻译预处理过程中的分词和语料标注问题进行研究,缓解语料词汇受限问题。同时为提高译文质量,对端到端模型的构建过程展开研究。本文在端到端机器翻译模型的预处理阶段对于语料的分词算法进行研究,给出一种基于隐马尔可夫模型(Hidden Markov Model,HMM)的分词模型进行序列的分词标注。同时使用判别式方式和条件随机场(Conditional Random Field,CRF)模型来对蒙古语进行词干词缀的切分和标注。在语料的表示上,以低维的分布式表示方法来处理蒙汉双语语料中的词语向量化问题,以此来适应端到端模型的输入和输出。针对蒙汉机器翻译中译文忠实度问题,结合主流的神经机器翻译端到端框架构建一种基于卷积神经网络(Convolution Neural N... 

【文章来源】:内蒙古工业大学内蒙古自治区

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

基于端到端神经网络的蒙汉机器翻译的研究


蒙古语词表

矩阵图,蒙汉,单词,蒙古语


基于单词的蒙汉对齐矩阵Figure4-5Mongolian-ChineseAlignmentMatrixBasedonWord

配置脚本


配置脚本Figure5-1ConfigurationScript

【参考文献】:
期刊论文
[1]多通道卷积的图像超分辨率方法[J]. 李云飞,符冉迪,金炜,纪念.  中国图象图形学报. 2017(12)
[2]基于在线神经网络算法的混合试验方法[J]. 王涛,翟绪恒,孟丽岩,王贞.  振动与冲击. 2017(14)
[3]基于基本图像特征的中朝文种辨识方法[J]. 张鹏,崔荣一.  延边大学学报(自然科学版). 2017(02)
[4]初始化卷积神经网络的主成分洗牌方法[J]. 李玉鑑,沈成恺,杨红丽,胡海鹤.  北京工业大学学报. 2017(01)
[5]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春.  计算机科学. 2016(06)
[6]蒙古文词性标注及融合词性因子的蒙汉统计机器翻译[J]. 玉霞,王斯日古楞.  内蒙古师范大学学报(自然科学汉文版). 2015(03)
[7]基于HMM算法体系的逆维特比算法理论研究[J]. 刘功生,张春良,岳夏,朱厚耀.  机电工程技术. 2014(11)
[8]少数民族语言文字使用情况调查述要[J]. 黄行.  民族翻译. 2013(03)
[9]基于篇章上下文的统计机器翻译方法[J]. 于惠,谢军,熊皓,吕雅娟,刘群,林守勋.  中文信息学报. 2013(02)
[10]机器翻译中的术语错译分析[J]. 罗季美.  中国科技术语. 2013(01)

博士论文
[1]深度学习模型的高效训练算法研究[D]. 陈凯.中国科学技术大学 2016

硕士论文
[1]基于注意力神经网络的蒙汉机器翻译系统的研究[D]. 申志鹏.内蒙古大学 2017
[2]基于串到树模型的蒙汉机器翻译研究[D]. 员华瑞.内蒙古大学 2015



本文编号:2967961

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/2967961.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户61784***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com