基于深度学习的标点预测研究
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图2.3LSTM网络结构??I??Figure?2.3?The?network?structure?of?LSTM??I??长短时记忆网络(LSTM)?1|61使用目的内存单元来存储信息,这是为丫克服上??
基于深度学习的中文语音转录标点预测研究??爆炸的问题[15],它只能访问有限的上下文范围,所以提出了?LSTM的结构,如??图2.3所示。??V?!??Output?Gate?“??\?@??\?“??\?Forget?Gate??/?V?/??、一’??Input?Gate?“....
图2.1隐马可夫过程
图2.1隐马可夫过程Figure2.1HiddenMarkovprocess示例共分为两层。第一层是马尔科夫转移过程,第二层是该行的输出,也就以观测的输出。通常把马尔可夫过程第一层转移过程的状态叫做隐藏状态,层可以被观察到的输出叫做观察状态。隐马尔科夫是一个更强的假设....
图2.2跳跃模型
图2.2跳跃模型Figure2.2Skip-gramip-gram的运行方式主要有以下几步骤:对单词生成one-hot输入向量xkxk得到上下文的嵌入词向量vc=Vxvc=Vx通过u=Uucu=Uuc产生2m个得分向量ucm,...,uc1,uc....
图4.1tanh激活函数Figure4.1tanhactivationfunction观察图像可以发现tanh激活函数在两端导数无限接近0
图4.1tanh激活函数Figure4.1tanhactivationfunction观察图像可以发现tanh激活函数在两端导数无限接近0。当两端继续向外扩散时,导数就更加趋近于0。当出现这种情况时,便可以把这种情况称作神经单元已经饱和。由于它们梯度变为0,....
本文编号:3929072
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3929072.html