面向汉英专利文献的神经网络翻译模型的集外词翻译研究
本文选题:神经网络机器翻译 切入点:集外词 出处:《北京交通大学》2017年硕士论文
【摘要】:机器翻译(Machine Translation,MT)的目的是为源语言找到一个意思最为相近的目标语言。从本质上来看,机器翻译完成的是一个序列到序列的任务。近年来随着深度神经网络(Deep Neural Network,DNN)在语音识别和图像处理等方面取得突破性进展,研究人员开始着手使用深度神经网络处理符号变量方面的问题,例如自然语言处理领域的机器翻译任务。神经网络机器翻译(Neural Machine Translation,NMT)包含编码器和解码器两个神经网络,编码器把源语言转化成一个向量表示,解码器根据源语言的向量表示加上目标语言的历史信息生成目标语言的词序列。为了控制计算复杂度,大多数的NMT系统会限制源语言和目标语言的词典大小,一般设置为三万词到八万词之间。对于不在词典中的词,也就是集外词,使用符号“UNK”来代替。集外词带来几个问题,一个是在测试过程中,模型不能够生成合适的翻译结果;另一个是集外词导致源语言句子语义无法正确表示,加重翻译结果的歧义现象;第三个是训练语料中源语言和目标语言句子结构被严重破坏,神经网络参数质量不高。在专利文献语料中存在大量的低频词,导致这几个问题更为严重。本论文以专利文献的集外词翻译为切入点,以中英神经网络机器翻译为主要研究方向,重点研究并提出了一种改善集外词翻译问题的方法,从而提高神经网络机器翻译的效果。主要研究成果如下:(1)引入统计机器翻译中的对齐信息,以外部信息的形式加入语料库词典,当出现集外词时根据神经网络机器翻译中的注意力机制,对集外词进行翻译。(2)对语料中的技术术语进行标签化处理,以前后处理的方式翻译技术术语。(3)加入多模型融合机制,即同时训练多个翻译模型,在解码时根据多个翻译模型得到的结果调整注意力机制权重信息,挑选最优结果。本文将集外词处理作为研究重点,在中英专利语料上的实验结果表明,本文提出的方法能有效的处理集外词和专利术语,使翻译效果得到提升。
[Abstract]:The purpose of machine translation is to find a target language with the most similar meaning for the source language.In essence, machine translation performs a sequence-to-sequence task.In recent years, with the breakthrough of deep Neural network in speech recognition and image processing, researchers have begun to use deep neural networks to deal with symbolic variables.For example, the task of machine translation in the field of natural language processing.Neural Machine Translation (NMTT) consists of two neural networks: encoder and decoder. The encoder converts the source language into a vector representation.Based on the vector representation of the source language and the historical information of the target language, the decoder generates the word sequence of the target language.In order to control computational complexity, most NMT systems limit the size of the dictionary between the source language and the target language, generally between 30,000 and 80,000 words.For words that are not in the dictionary, that is, out-of-set words, the symbol "UNK" is used instead.One is that the model can not produce appropriate translation results in the testing process, the other is that the out-of-set words can not correctly express the sentence semantics of the source language, thus aggravating the ambiguity of the translation results.The third is that the sentence structure of the source language and target language in the training corpus is seriously damaged, and the quality of neural network parameters is not high.The existence of a large number of low-frequency words in the patent literature corpus makes these problems more serious.In this thesis, we focus on the translation of off-set words in patent literature and the main research direction of Chinese-English neural network machine translation, and put forward a method to improve the translation of off-set words in order to improve the effect of neural network machine translation.The main research results are as follows: (1) introducing the alignment information in statistical machine translation, adding the corpus dictionary in the form of external information, and according to the attention mechanism of neural network machine translation when the out-of-set words appear.(2) tagging the technical terms in the corpus, and the former post-processing mode of translating the technical terms. 3) adding a multi-model fusion mechanism, that is, training several translation models simultaneously.In decoding, the weight information of attention mechanism is adjusted according to the results obtained from multiple translation models, and the optimal results are selected.The experimental results on the Chinese and English patent corpus show that the method proposed in this paper can effectively deal with extrinsic words and patent terms and improve the translation effect.
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.2;TP183
【相似文献】
相关期刊论文 前10条
1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期
2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
相关会议论文 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
相关博士学位论文 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
相关硕士学位论文 前10条
1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
,本文编号:1714104
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1714104.html