后验概率图与补白模型二次融合的关键词识别
发布时间:2021-05-24 03:38
使用全连接神经网络结合Softmax分类器对汉语的408个音节建立音节分类器,利用等长处理后的特征向量训练Softmax分类器,将Softmax分类器输出概率作为后验概率图,与隐马尔科夫补白模型(HMM/Filler)进行第一次融合,得到子后验概率图隐马尔科夫模型(Posteriorgram-HMM).针对关键词训练样本较少的问题,将标注样本进行强制切分,得到HMM每个状态上的训练数据.将隐马尔科夫最大后验概率基线模型(HMM-MAP)与Posteriorgram-HMM进行第二次融合,提出最大后验概率图隐马尔科夫模型(Posteriorgram-HMM-MAP).在数据集上训练模型后,使用测试数据对其进行测试.结果表明:Posteriorgram-HMM-MAP的综合识别率相比PosteriorgramHMM提升了3.55%,相比HMM/Filler提升了10.29%.
【文章来源】:浙江大学学报(工学版). 2020,54(06)北大核心EICSCD
【文章页数】:7 页
【参考文献】:
期刊论文
[1]基于深度神经网络的关键词识别系统[J]. 孙彦楠,夏秀渝. 计算机系统应用. 2018(05)
[2]基于双门限算法的端点检测改进研究[J]. 王满洪,张二华,王明合. 计算机与数字工程. 2017(11)
[3]基于改进MFCC特征的语音识别算法[J]. 邵明强,徐志京. 微型机与应用. 2017(21)
[4]基于Viterbi改进算法的汉语数码语音识别系统[J]. 陈洁群. 微型机与应用. 2017(14)
[5]基于DTW的语音关键词检出[J]. 侯靖勇,谢磊,杨鹏,肖雄,梁祥智,徐海华,王磊,吕航,马斌,CHNG EngSiong,李海洲. 清华大学学报(自然科学版). 2017(01)
[6]基于离散HMM的非特定人关键词提取语音识别系统[J]. 汪鹏,刘加,刘润生. 吉林大学学报(理学版). 2003(03)
博士论文
[1]语音关键词识别技术的研究[D]. 孙成立.北京邮电大学 2008
本文编号:3203478
【文章来源】:浙江大学学报(工学版). 2020,54(06)北大核心EICSCD
【文章页数】:7 页
【参考文献】:
期刊论文
[1]基于深度神经网络的关键词识别系统[J]. 孙彦楠,夏秀渝. 计算机系统应用. 2018(05)
[2]基于双门限算法的端点检测改进研究[J]. 王满洪,张二华,王明合. 计算机与数字工程. 2017(11)
[3]基于改进MFCC特征的语音识别算法[J]. 邵明强,徐志京. 微型机与应用. 2017(21)
[4]基于Viterbi改进算法的汉语数码语音识别系统[J]. 陈洁群. 微型机与应用. 2017(14)
[5]基于DTW的语音关键词检出[J]. 侯靖勇,谢磊,杨鹏,肖雄,梁祥智,徐海华,王磊,吕航,马斌,CHNG EngSiong,李海洲. 清华大学学报(自然科学版). 2017(01)
[6]基于离散HMM的非特定人关键词提取语音识别系统[J]. 汪鹏,刘加,刘润生. 吉林大学学报(理学版). 2003(03)
博士论文
[1]语音关键词识别技术的研究[D]. 孙成立.北京邮电大学 2008
本文编号:3203478
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3203478.html