一种多尺度前向注意力模型的语音识别方法
发布时间:2021-01-04 06:26
注意力模型是当前语音识别中的主流模型,然而其存在一个缺点,即当前时刻的注意力模型可能产生异常得分.为此,本文首先提出前向注意力模型,其采用上一时刻正常注意力得分平滑当前时刻异常得分.接着通过对上一时刻的注意力得分添加约束因子来对前向注意力模型进行优化,达到自适应平滑的目的.最后,在优化模型基础上提出多尺度前向注意力模型,其通过引入多尺度模型来对不同等级的语音基元进行建模,进而将所得到的不同等级目标向量进行融合,以达到解决注意力得分异常值的目的.采用SwitchBoard作为训练集,Hub5’00作为测试集进行实验,相比于基线系统,多尺度前向注意力模型的词错误率(Word Error Rate,WER)相对降低14.28%.
【文章来源】:电子学报. 2020年07期 北大核心
【文章页数】:6 页
【文章目录】:
1 引言
2 传统注意力模型的语音识别
3 基于前向注意力模型的语音识别模型
4 基于多尺度前向注意力模型的语音识别模型
5 实验结果及分析
5.1 实验数据库
5.2 实验参数设置
5.3 实验结果及分析
6 结论
【参考文献】:
期刊论文
[1]Using Highway Connections to Enable Deep Small-footprint LSTM-RNNs for Speech Recognition[J]. CHENG Gaofeng,LI Xin,YAN Yonghong. Chinese Journal of Electronics. 2019(01)
[2]Speech Magnitude Spectrum Reconstruction from MFCCs Using Deep Neural Network[J]. JIANG Wenbin,LIU Peilin,WEN Fei. Chinese Journal of Electronics. 2018(02)
[3]Agglutinative Language Speech Recognition Using Automatic Allophone Deriving[J]. XU Ji,PAN Jielin,YAN Yonghong. Chinese Journal of Electronics. 2016(02)
本文编号:2956319
【文章来源】:电子学报. 2020年07期 北大核心
【文章页数】:6 页
【文章目录】:
1 引言
2 传统注意力模型的语音识别
3 基于前向注意力模型的语音识别模型
4 基于多尺度前向注意力模型的语音识别模型
5 实验结果及分析
5.1 实验数据库
5.2 实验参数设置
5.3 实验结果及分析
6 结论
【参考文献】:
期刊论文
[1]Using Highway Connections to Enable Deep Small-footprint LSTM-RNNs for Speech Recognition[J]. CHENG Gaofeng,LI Xin,YAN Yonghong. Chinese Journal of Electronics. 2019(01)
[2]Speech Magnitude Spectrum Reconstruction from MFCCs Using Deep Neural Network[J]. JIANG Wenbin,LIU Peilin,WEN Fei. Chinese Journal of Electronics. 2018(02)
[3]Agglutinative Language Speech Recognition Using Automatic Allophone Deriving[J]. XU Ji,PAN Jielin,YAN Yonghong. Chinese Journal of Electronics. 2016(02)
本文编号:2956319
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2956319.html