当前位置:主页 > 科技论文 > 信息工程论文 >

基于MTL-DNN系统融合的混合语言模型语音识别方法

发布时间:2018-04-08 22:11

  本文选题:集外词 切入点:混合模型 出处:《数据采集与处理》2017年05期


【摘要】:基于混合语言模型的语音识别系统虽然具有可以识别集外词的优点,但是集外词识别准确率远低于集内词。为了进一步提升混合语音识别系统的识别性能,本文提出了一种基于互补声学模型的多系统融合方法。首先,通过采用不同的声学建模单元,构建了两套基于隐马尔科夫模型和深层神经网络(Hidden Markov model and deep neural network,HMM-DNN)的混合语音识别系统;然后,针对这两种识别任务之间的关联性,采用多任务学习(Multi-task learning DNN,MTL-DNN)思想,实现DNN网络输入层和隐含层的共享,并通过联合训练提高建模精度。最后,采用ROVER(Recognizer output voting error reduction)方法对两套系统的输出结果进行融合。实验结果表明,相比于单任务学习DNN(Single-task learning DNN,STL-DNN)建模方式,MTL-DNN可以获得更好的识别性能;将两个系统的输出进行融合,能够进一步降低词错误率。
[Abstract]:Although the speech recognition system based on the hybrid language model has the advantage of recognizing extrinsic words, the accuracy of extrinsic words recognition is much lower than that of intra-set words.In order to improve the recognition performance of hybrid speech recognition system, a multi-system fusion method based on complementary acoustic model is proposed in this paper.Firstly, two hybrid speech recognition systems based on Hidden Markov model and deep neural Network (HMM-DNN) are constructed by using different acoustic modeling units.Multi-task learning learning MTL-DNN is adopted to realize the sharing of input layer and hidden layer in DNN network, and the modeling accuracy is improved by joint training.Finally, the output results of the two systems are fused by ROVER(Recognizer output voting error reduction method.The experimental results show that the MTL-DNN can obtain better recognition performance than the single-task learning DNN(Single-task learning DNNN (STL-DNNN) modeling method, and can further reduce the word error rate by merging the output of the two systems.
【作者单位】: 解放军信息工程大学信息系统工程学院;
【基金】:国家自然科学基金(61175017,61403415,61302107)资助项目
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 吴军,,王作英;汉语信息熵和语言模型的复杂度[J];电子学报;1996年10期

2 金凌,吴文虎,郑方,吴根清;距离加权统计语言模型及其应用[J];中文信息学报;2001年06期

3 陈浪舟,黄泰翼,nlpr.ia.ac.cn;基于模糊训练集的领域相关统计语言模型[J];软件学报;2000年07期

4 刘长娥;王世镇;刘加;夏善红;;语种确认中基于段长的语言模型修正方法[J];计算机应用研究;2006年07期

5 张瑞强,王作英,陆大 ;关于汉语音字转换中语言模型零概率的问题[J];电子学报;1998年08期

6 汪洪波;;高效的语音识别系统[J];中国物流与采购;2006年12期

7 汪洪波;;语音识别系统在配送中心的应用[J];信息与电脑;2006年06期

8 杨q

本文编号:1723568


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1723568.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户080cc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com