基于递归神经网络的语音识别快速解码算法
本文选题:语音识别 + 递归神经网络 ; 参考:《电子与信息学报》2017年04期
【摘要】:递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。
[Abstract]:Recurrent Neural Network (RNN) has been widely used in acoustic modeling of automatic Speech recognition (ASR).Although it has a great advantage over the traditional acoustic modeling method, the relatively high computational complexity limits the application of this neural network, especially in real-time application scenarios.Since the input features used in recurrent neural networks usually have a long context it is possible to reduce the time complexity of acoustic posteriori and token passing by using overlapping information at the same time.In this paper, a new decoder structure is introduced, which can reduce the computation cost of decoding by regularly discarding overlapped frames.In particular, this method can be directly applied to the original recurrent neural network model, with small changes in the Hidden Markov Model (HMMs) structure, which makes this method highly flexible.In this paper, the delay neural network is taken as an example to verify the proposed method, and it is proved that the proposed method can achieve a speedup ratio of 2 to 4 times when the precision loss is relatively small.
【作者单位】: 中国科学院声学研究所语言声学与内容理解重点实验室;中国科学院大学;中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室;
【基金】:国家自然科学基金(U1536117,11590770-4) 国家重点研发计划重点专项(2016YFB0801200,2016YFB0801203) 新疆维吾尔自治区科技重大专项(2016A03007-1)~~
【分类号】:TP183;TN912.34
【相似文献】
相关期刊论文 前10条
1 金仁贵;;带有偏差单元的递归神经网络在故障诊断方面的应用[J];电脑知识与技术;2006年29期
2 陈钢;王占山;;连续时间递归神经网络的稳定性分析[J];沈阳理工大学学报;2007年02期
3 汪晓梦;;带有偏差单元的递归神经网络在故障诊断方面的应用优化[J];甘肃联合大学学报(自然科学版);2010年05期
4 杜艳可;徐瑞;;具有时滞的递归神经网络动力学研究进展[J];北华大学学报(自然科学版);2012年01期
5 蒋洪睿,莫玮,李丽;递归神经网络自适应均衡抗突发干扰研究[J];电讯技术;2000年01期
6 宋轶民,余跃庆,张策,马文贵;动态递归神经网络及其在机敏机构辨识中的应用[J];机械科学与技术;2001年04期
7 张奇志,贾永乐,周雅莉;噪声有源控制的递归神经网络方法[J];控制与决策;2001年03期
8 李峰,李树荣;基于动态递归神经网络的动态矩阵控制[J];石油大学学报(自然科学版);2001年03期
9 唐普英,李绍荣,黄顺吉;一种新的复值递归神经网络训练方法及其应用[J];信号处理;2001年06期
10 文敦伟,蔡自兴;递归神经网络的模糊随机学习算法[J];高技术通讯;2002年01期
相关会议论文 前10条
1 房毅宪;王宝文;王永茂;;基于偏差递归神经网络的股价预测(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
2 刘勇;沈毅;胡恒章;;递归神经网络自适应滤波器[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
3 赵英凯;蔡宁;;基于对角递归神经网络的肟化投酮量在线预估[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
4 李树荣;李峰;;基于动态递归神经网络的非线性系统重构[A];1998年中国控制会议论文集[C];1998年
5 史志伟;韩敏;;应用递归神经网络建立非线性结构系统模型[A];第二十三届中国控制会议论文集(下册)[C];2004年
6 丛爽;戴谊;;递归神经网络逼近性能的研究[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
7 吕进;郭晨;刘雨;;基于不完全递归神经网络的二阶导数多步预测模糊控制及应用[A];2007年中国智能自动化会议论文集[C];2007年
8 蒲兴成;;时变时滞不确定递归神经网络渐近稳定的一个充分条件[A];2008’“先进集成技术”院士论坛暨第二届仪表、自动化与先进集成技术大会论文集[C];2008年
9 仉宝玉;吴志敏;;基于对角递归神经网络的智能PID控制[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
10 沈艳;谢美萍;;基于递归神经网络的船舶运动极短期建模预报[A];第二届全国信息获取与处理学术会议论文集[C];2004年
相关博士学位论文 前10条
1 赵永昌;一类时滞静态递归神经网络的动力学行为研究[D];中国海洋大学;2010年
2 高海宾;扰动作用下递归神经网络稳定性研究[D];燕山大学;2006年
3 黄玉娇;具有广义分段线性激活函数的递归神经网络的多稳定性分析[D];东北大学;2014年
4 徐东坡;递归神经网络梯度学习算法的收敛性[D];大连理工大学;2009年
5 于佳丽;递归神经网络的连续吸引子与模糊控制[D];电子科技大学;2009年
6 王芬;递归神经网络的动力学行为分析[D];武汉科技大学;2011年
7 季策;时滞递归神经网络的动态特性研究[D];东北大学;2005年
8 徐军;递归神经网络稳定性分析[D];浙江大学;2007年
9 张锐;几类递归神经网络的稳定性及其应用研究[D];东北大学;2010年
10 张益军;时滞递归神经网络稳定性分析及网络化同步控制[D];东华大学;2008年
相关硕士学位论文 前10条
1 柳玉华;一种递归神经网络方法研究及其在非线性系统跟踪控制中的应用[D];江西理工大学;2015年
2 罗威威;全局指数稳定的递归神经网络的鲁棒性分析[D];中国矿业大学;2015年
3 杨渺渺;具有时滞的递归神经网络稳定性分析[D];电子科技大学;2015年
4 崔志超;基于产品特征的中文评论情感分析系统设计与实现[D];河北科技大学;2015年
5 余仕敏;基于递归神经网络的广告点击率预估[D];浙江理工大学;2016年
6 宛立达;基于振动信号分析的故障诊断理论与应用[D];东北石油大学;2010年
7 李克强;基于Spark的大规模RNNLM系统[D];江苏大学;2016年
8 谢伟浩;基于多尺度时间递归神经网络的人群异常检测[D];广东工业大学;2016年
9 曹成远;基于深度学习的蛋白质残基相互作用预测[D];苏州大学;2016年
10 梁军;基于深度学习的文本特征表示及分类应用[D];郑州大学;2016年
,本文编号:1760972
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1760972.html