基于注意力神经网络的蒙汉机器翻译系统的研究
[Abstract]:In recent years, in-depth learning has become a hot topic in many fields. For machine translation tasks in the field of natural language processing, the emergence of sequence-to-sequence neural network translation system breaks the situation of multi-module coordination and combination of traditional machine translation, and the integrated structure. Satisfactory translation results have attracted the attention of scholars from the beginning. Later, the neural network based on attention (Attention-based) further improved the model, which made the translation effect exceed the traditional statistical machine translation system to a certain extent and become one of the mainstream translation systems. In this paper, based on the research background of attention neural network, combined with the recent scientific research results, The research on Mongolian-Chinese machine translation system based on attention neural network is carried out from the following three aspects: (1) the pre-training of Mongolian word vector: word vector is the representation of words directly involved in model training. The quality of the training is directly related to the quality of the translation model of the final training, so we explore three pre-training methods of Mongolian word vectors to improve the quality of translation. (2) Mongolian word segmentation based on dictionary: the character of Mongolian word formation will cause serious data sparse problem in training corpus. Based on dictionary, we affix Mongolian words. In order to alleviate the problem of sparse data, word segmentation with different granularity, such as the additional components of word stem passing, can be used to alleviate the problem of sparse data. (3) Mongolian feature extraction: for Mongolian, the additional components of stem, affix and case are the language features of word formation. We also extract these language features as features to participate in the systematic training based on dictionaries. In order to improve the translation effect of neural network translation system. Finally, we construct and improve a complete Mongolian-Chinese translation system based on attention neural network. The experimental results show that, based on our method, the BLEU score of the system is up to 2.47 percentage points higher than that of the baseline system, and the optimal model BLEU value is 30.19%.
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.2;TP183
【相似文献】
相关期刊论文 前10条
1 胡景凡,周锡令;受限汉语与汉英机器翻译系统鍌[J];计算机工程与应用;2000年11期
2 屈刚,孔骏,陆汝占;一个基于范例推理的机器翻译系统[J];计算机工程;2000年10期
3 ;赛迪集团北京中电报科技发展有限公司高科技产品介绍之一:新一代英汉机器翻译系统[J];中国计算机用户;2004年35期
4 肖明;;机器翻译系统中间件模型[J];福建电脑;2006年03期
5 马丽;李平;王秀英;赵丽华;;机器翻译系统的模糊评价方法[J];微计算机信息;2008年01期
6 李青;黄金柱;;语义块主辅变换在机器翻译系统中的应用[J];洛阳师范学院学报;2010年05期
7 路学;我国实用机器翻译系统的开发策略[J];现代图书情报技术;1990年01期
8 徐剑,梁茂成;对几种英汉机器翻译系统的测评[J];语言文字应用;1999年02期
9 孙爽;石莹;;ЭТАП-3机器翻译系统研究[J];哈尔滨师范大学社会科学学报;2013年05期
10 ;其它计算机与系统[J];电子科技文摘;2000年06期
相关会议论文 前10条
1 宋金平;肖健;孙广范;;面向北京奥运会的定制化英汉机器翻译系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 范莉馨;任福继;宫永喜一;(木厉)内香次;;一个利用句子结构特征实现的中日机器翻译系统[A];中国科学技术协会首届青年学术年会论文集(工科分册·上册)[C];1992年
3 任福继;范莉馨;;基于家族模型的日中机器翻译系统[A];中国科学技术协会首届青年学术年会论文集(工科分册·上册)[C];1992年
4 傅爱平;;英汉机器翻译系统的语言分析和算法设计[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 田中康仁;;关于机器翻译系统未来的方向[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 陈群秀;;计算机辅助翻译系统漫谈[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 洪忻;任燕;;中软译星机器翻译系统翻译质量改进策略[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
8 吴闯;吴宏林;张俐;刘绍明;;基于文本-模板直接匹配的机器翻译系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 熊维;王震;于新;刘汇丹;诺明花;马龙龙;张立强;洪锦玲;吴健;;ISCAS机器翻译系统与评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
相关重要报纸文章 前3条
1 董振东;到用户中去[N];中国计算机报;2003年
2 ;我国首个基于搜索引擎的机器翻译系统问世[N];中国高新技术产业导报;2008年
3 刘慧敏;多语信息平台让你“读懂”七国语言[N];宁波日报;2007年
相关博士学位论文 前5条
1 关晓薇;基于语义语言的机器翻译系统中若干关键问题研究[D];大连理工大学;2009年
2 胡春玲;人机互动的多策略机器翻译系统中跟踪记忆机制的研究[D];中国科学院研究生院(计算技术研究所);2000年
3 王博;机器翻译系统的自动评价及诊断方法研究[D];哈尔滨工业大学;2010年
4 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
5 乌日力嘎;西里尔蒙古文—汉文机器翻译系统的实现[D];内蒙古大学;2015年
相关硕士学位论文 前10条
1 姚振宇;基于复述的机器翻译系统融合方法研究[D];哈尔滨工业大学;2015年
2 葛译蔓;基于安全领域的维汉机器翻译系统研究[D];吉林大学;2015年
3 朱长峰;短语机器翻译系统中翻译搜索策略的研究[D];南京大学;2015年
4 赵轶凡;基于iOS平台的实时机器翻译系统的设计与实现[D];北京交通大学;2016年
5 张帅;基于本体的英蒙机器翻译系统设计与实现[D];内蒙古大学;2016年
6 杨亚敏;在线机器翻译系统质量对比研究[D];扬州大学;2016年
7 洪X绿;机器翻译系统比较[D];北京外国语大学;2017年
8 王琳;知网机器翻译系统的分析与知识库扩展[D];沈阳航空航天大学;2017年
9 王芳;《面向译员的机器翻译系统》(第一章)翻译实践报告[D];郑州大学;2017年
10 王峰;融合互联网引擎的机器翻译系统[D];内蒙古大学;2017年
,本文编号:2486662
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2486662.html