低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统
发布时间:2017-07-03 23:15
本文关键词:低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统
【摘要】:语音识别系统需要大量有标注训练数据,在低数据资源条件下的识别性能往往不理想.针对数据匮乏问题,本文先研究子空间高斯混合声学模型通过参数共享减少待估计的参数规模,并使用基于最大互信息准则的区分型训练技术提高识别精度;而后在特征层面应用基于深度神经网络的Bottleneck特征来达到特征提取和降维的目的;最后将上述研究成果结合并构建了低资源条件下的语音识别系统.在国际标准的Open KWS 2013数据库上的实验结果表明,本文的技术能够有效改善低资源条件下的系统识别性能,相比基线系统有12%左右的词错误率降低.
【作者单位】: 中国科学院大学;中国科学院电子学研究所传感技术国家重点实验室;清华大学电子工程系清华信息科学与技术国家实验室;
【关键词】: 语音识别 低资源 声学模型 声学特征
【基金】:国家自然科学基金(61005019,61273268,61370034,90920302) 北京市自然科学基金(KZ201110005005)资助
【分类号】:TN912.34
【正文快照】: Wu W L,Cai M,Tian Y,et al.Bottleneck features and subspace Gaussian mixture models for low-resource speechrecognition[J].Journal of University of Chinese Academy of Sciences,2015,32(1):97-102.standard Open KWS 2013 evaluation corpus,experimental results ,
本文编号:515553
本文链接:https://www.wllwen.com/kejilunwen/wltx/515553.html