子空间域相关特征变换与融合的语音识别方法
发布时间:2017-08-14 04:27
本文关键词:子空间域相关特征变换与融合的语音识别方法
更多相关文章: 语音识别 区分性训练 深度神经网络 子空间域相关特征变换
【摘要】:为了提高语音识别准确率,提出了一种子空间域相关特征变换与融合的语音识别方法(MFCC-BN-TC方法)。该方法提取语音短时谱结构特征(BN)和包络特征(MFCC)分别描述语音短时谱结构和包络信息,并采用域相关特征变换的形式分别对BN和MFCC特征进行特征变换;然后对这种变换进行泛化扩展提出子空间域相关特征变换,以采用不同的时间颗粒度(帧和语音分段)进行多层次区分性特征表达;最后,对多种区分性特征变换后的特征进行联合表征训练声学模型,并给出了区分性特征变换与融合的一般框架。实验结果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基线系统方法,识别性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法变换以后的语音信号特征,相比于融合原始特征,识别率提升了1.5%。
【作者单位】: 解放军信息工程大学信息系统工程学院;山东大学信息科学与工程学院;
【关键词】: 语音识别 区分性训练 深度神经网络 子空间域相关特征变换
【基金】:国家自然科学基金资助项目(61175017;61403415)
【分类号】:TN912.34
【正文快照】: 自动语音识别是将人类自然语音转化为文本或命令的技术,是实现与机器“友好式”交流的重要技术之一。为提高语音识别率,常对特征参数进行某种变换[1-2],以得到具有鲁棒性和区分性的特征。其中以采用高斯混合模型进行声学空间划分的最小音素错误率(feature minimum phone error
【相似文献】
中国硕士学位论文全文数据库 前1条
1 王斐;特征变换方法及其在SAR目标鉴别上的应用[D];西安电子科技大学;2014年
,本文编号:670775
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/670775.html