基于RNN-RBM语言模型的语音识别研究
本文选题:语音识别 切入点:语言模型 出处:《计算机研究与发展》2014年09期 论文类型:期刊论文
【摘要】:近年来深度学习兴起,其在语言模型领域有着不错的成效,如受限玻尔兹曼机(restricted Boltzmann machine,RBM)语言模型等.不同于N-gram语言模型,这些根植于神经网络的语言模型可以将词序列映射到连续空间来评估下一词出现的概率,以解决数据稀疏的问题.此外,也有学者使用递归神经网络来建构语言模型,期望由递归的方式充分利用所有上文信息来预测下一词,进而有效处理长距离语言约束.根据递归受限玻尔兹曼机神经网络(recurrent neural network-restricted Boltzmann machine,RNN-RBM)的基础来捕捉长距离信息;另外,也探讨了根据语言中语句的特性来动态地调整语言模型.实验结果显示,使用RNN-RBM语言模型对于大词汇连续语音识别的效能有相当程度的提升.
[Abstract]:In recent years, the rise of in-depth learning has a good effect in the field of language modeling, such as restricted Boltzmann machine restricted Boltzmann model, which is different from N-gram language model. These neural network-based language models can map word sequences to a continuous space to evaluate the probability of the next word appearing to solve the problem of sparse data. In addition, some scholars use recurrent neural networks to construct language models. It is expected that all the above information can be used recursively to predict the next term and thus deal with long distance language constraints effectively. The long distance information is captured according to the recurrent neural network-restricted Boltzmann machine RNN-RBM, which is based on the recurrent neural network-restricted Boltzmann machine neural network of recursive constrained Boltzmann machine. This paper also discusses how to dynamically adjust the language model according to the characteristics of sentences in the language. The experimental results show that the effectiveness of using the RNN-RBM language model for the continuous speech recognition of large vocabulary is improved to a considerable extent.
【作者单位】: 湖北科技学院网络管理中心;弗吉尼亚理工大学信息技术中心;湖北科技学院外国语学院;中南财经政法大学外国语学院;
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
2 张建平;语音识别与理解的语言统计模型和搜索算法[J];电子商务;1999年09期
3 申广忠;;蒙古语语音识别系统语言模型的设计[J];微计算机信息;2007年12期
4 吴军,,王作英;汉语信息熵和语言模型的复杂度[J];电子学报;1996年10期
5 田野,李涓子,王作英,陆大金;电话语音识别系统[J];计算机工程与应用;2001年13期
6 沈兆勇;顾明亮;;基于符号化和语言模型方法的汉语方言自动辨识[J];徐州师范大学学报(自然科学版);2006年02期
7 孙静,朱杰,徐向华;汉语语音识别中的加权概念转移网络语言模型[J];上海交通大学学报;2003年10期
8 许永林,史晓东,蔡骏;利用FP-树构造多词Trigger对语言模型[J];厦门大学学报(自然科学版);2005年S1期
9 王仕超;;基于HTK的语音识别的语料搜集与语言模型[J];硅谷;2010年20期
10 汪志鸿;于水源;杜利民;;使用期待提高对话系统的语音识别率[J];黑龙江大学自然科学学报;2006年01期
相关会议论文 前10条
1 陈振标;徐波;;限定领域的语言模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
2 苏韬;汪俊杰;孙甲松;王作英;;基于最大似然估计的语言模型自适应[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 张建平;庹凌云;孙宝海;汪俊杰;刘建;颜永红;;LVCSR系统中语言模型的参数选择与性能评测[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
4 吴根清;郑方;金凌;吴文虎;;一种在线递增式语言模型自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 吴宗宪;王骏发;;语音辨认中阶层式以文法为主之马可夫语言模型[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 林小俊;田浩;王馨浩;杜蕴璇;许敏;吴玺宏;迟惠生;;语言模型训练语料处理方法及解码词典的设计[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 颜龙;刘刚;郭军;;汉语大词汇连续语音识别系统的研究[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 张家
本文编号:1633530
本文链接:https://www.wllwen.com/kejilunwen/wltx/1633530.html