深度神经网络技术在汉语语音识别声学建模中的优化策略
发布时间:2018-05-09 13:44
本文选题:深层神经网络 + 语音识别 ; 参考:《重庆邮电大学学报(自然科学版)》2014年03期
【摘要】:将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均相对降低15%。实验结果表明,所采用优化策略可以有效地改善深度神经网络声学模型性能。
[Abstract]:The depth neural network is used as the acoustic model in the speech recognition system for natural spoken conversation of Chinese telephone. Aiming at the problem of high recognition error rate in natural spoken language, this paper starts with the selection of acoustic feature types of speech, the adjustment of model training time element parameters, and the improvement of model generalization ability, etc. The acoustic modeling technology based on depth neural network is optimized. A state priori probability smoothing algorithm is proposed for sparse state prior probability distribution in training samples. To some extent, the problem of data sparsity is alleviated. After smoothing, the word error rate decreases by more than 1 bit. Compared with the depth neural network model before the optimization, the performance of the optimized model is consistently improved, and the word error rate is reduced by 15%. Experimental results show that the proposed optimization strategy can effectively improve the performance of depth neural network acoustic model.
【作者单位】: 中国科学院语言声学与内容理解重点实验室;
【基金】:国家自然科学基金(10925419,90920302,61072124,11074275,11161140319,91120001,61271426) 中国科学院战略性先导科技专项(XDA06030100,XDA06030500) 国家“863”计划(2012AA012503) 中科院重点部署项目(KGZD-EW-103-2)~~
【分类号】:TN912.34;TP183
【参考文献】
相关期刊论文 前1条
1 杜利民;侯自强;;自动语音识别研究的人工神经网络方法[J];物理学进展;1996年Z1期
【共引文献】
相关期刊论文 前1条
1 贾颖,杜利民,侯自强;一类目标函数的逆向构造[J];电子科学学刊;2000年02期
相关硕士学位论文 前3条
1 胡小平;支持向量机在说话人识别中的应用[D];南京理工大学;2003年
2 郑燕琳;汉语连续语音三字词基音提取及声调识别[D];吉林大学;2004年
3 张杰;基于WEKA平台和多分类器的少数民族语种识别研究[D];云南大学;2013年
【相似文献】
相关期刊论文 前10条
1 曾黄麟;;一类新的模式识别联想神经网络[J];电讯技术;1992年01期
2 陈在;;神经网络:一种全新的多媒体技术[J];重庆邮电学院学报(自然科学版);1993年01期
3 王卫,蔡德钧,,万发贯;神经网络在图像编码中的应用[J];电子学报;1995年07期
4 何振亚;计算智能信息处理[J];数据采集与处理;1996年02期
5 王磊;莫玉龙;;基于自反馈连续Hopfield网络复原运动模糊图象的研究[J];电子器件;1997年01期
6 王廷尧;神经计算技术在ATM光纤高速智能管理网中的应用(续)[J];光通信技术;2000年03期
7 李会方;李锋W
本文编号:1866240
本文链接:https://www.wllwen.com/kejilunwen/wltx/1866240.html