基于LSTM的交互式神经机器翻译方法研究
发布时间:2024-11-02 11:23
神经机器翻译系统在过去几年取得了很好的结果,但是仍然是有缺陷的。机器翻译系统的输出必须在后期编辑阶段由翻译人员进行校对。交互机器翻译促进了人机协作,提高生产力。在这项工作中,我们将神经机器翻译集成到交互式机器翻译框架中。利用seq2seq框架的特性,在解码阶段将翻译人员的纠正信息融合进机器翻译系统,在保持现有信息的情况进行重新解码翻译。并且利用翻译人员的的先验知识对神经翻译系统进行增量训练,以提高机器翻译系统的表现。
【文章页数】:4 页
【部分图文】:
本文编号:4009517
【文章页数】:4 页
【部分图文】:
传统的神经网络里,相互的输入没有关联,例如输入为X=(x1,x2,…,xn),其中x之间相互不影响,无论以何种方式进行输入,都不会对最终的结果产生影响。但是对于机器翻译来说,翻译一句话必须要考虑词之间的联系,从整体进行把握。RNN是处理序列数据的神经网络,每进行一次计算的时候,都....
如图3所示为LSTM网络内部结构图,LSTM与RNN具有相同的连接结构,标准RNN隐藏层中有一个网络层,但是LSTM在隐藏单元中使用三个门来控制信息。每一个LSTM中有三个输入:当前输入xt,上一步的细胞状态Ct-1,上一步隐藏层状态ht-1。σ是激活函数sigmoid。(1)遗....
(1)遗忘门:决定会从细胞状态中丢弃什么信息,见图4。该门通过读取ht-1和xt,与遗忘门权重矩阵Wf相乘,通过sigmoid得到一个数,与Ct-1相乘来选择保留或丢弃。
(3)输出门:最终决定LSTM的输出,见图6。根据ht-1和xt判断储存信息与当前输入的关联,决定输出哪些信息。首先用sigmoid来确定细胞状态的哪个部分将输出去。然后将状态Ct通过tanh处理,得到一个在-1到1之间的值,然后和sigmoid输出相乘,最终会输出我们确定输出的....
本文编号:4009517
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/4009517.html