基于深度学习的机器翻译建模方法研究
发布时间:2024-06-02 05:54
近些年自然语言处理技术取得了长足的发展,机器翻译技术也一直受到了研究者们广泛的关注。神经机器翻译技术其翻译模型简单,可操作性强,不需要大量专家知识,成为了主流翻译模型。但其仍面临许多问题。一方面,由于依赖于神经网络在大规模语料库上训练,所以模型训练的周期都特别长;另一方面,模型在翻译效果上仍不如人意,会出现漏译,误译等情况。神经机器翻译的两个主要问题是训练周期长以及翻译效果仍不理想。针对这两个问题,在模型的编码阶段和解码阶段分别进行了改进,分别提出了基于衰减权重损失函数的模型以及基于组嵌入的自然语言处理模型:(1)提出一种基于衰减权重的损失函数模型帮助在解码阶段进行训练。传统神经机器翻译的解码过程中,通常是利用之前翻译的词作为解码器的一部分输入进行下一个词的翻译,所以序列开头的词对翻译有更大的影响。基于衰减权重的损失函数会赋予越早出现的词更大的权重进行训练,从而让模型尽可能地翻译对先出现的词。在国际口语机器翻译评测比赛(IWSLT)翻译数据集上的德英机器翻译实验表明,使用了衰减权重损失函数的模型相比于传统恒定权重损失函数,翻译的bleu score上面最多提升了 1.63%。(2)提出...
【文章页数】:45 页
【学位级别】:硕士
【部分图文】:
本文编号:3986950
【文章页数】:45 页
【学位级别】:硕士
【部分图文】:
图1.1利用平行语料进行翻译(1)基于实例的翻译方法
1绪论料[4],包括公开资源软件本地化的语料和文档。AcquisCommunautaire语料是由欧盟成员国签订的法律文献的集合,有超过20多种语言。基于语料库的翻译方式如图1.1所示。按翻译方法提出的先后次序,基于语料库的机器翻译方法又可以进一步划分为基于实例的机器....
图1.2基于词的翻译模型
西安科技大学硕士学位论文T'=TargmaxP(T)P(S|T)要解决三个问题:估计语言模型概率P(T);速的搜索算法来求解T’使得P(T)P(T|S)最要求目标语言与源语言保持一致,估计语言模分为基于词的翻译模型(图1.2),基于短语的模型。于20世纪80年....
图1.3IBM模型1把词作为最小的翻译单元并不一定是最好的选择
译又可分为基于词的翻译模型(图1.2),基于短语的翻译的翻译模型。型起源于20世纪80年代末到90年代初IBMCandide项性工作。虽然这一技术已经跟不上最新的技术水平,但其适用。基于词的翻译模型的例子就是免费开源的工具包图1.2基于词的翻译模型IB....
图1.4基于短语的翻译模型
图1.4基于短语的翻译模型树的模型将句法假如到了机器翻译之中。而且能可以与基于短语的模型相媲美,在某些情况图1.5统计机器翻译的发展过程的翻译方法深度学习方法在特征表示和端到端建模方面具
本文编号:3986950
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3986950.html