当前位置:主页 > 科技论文 > 搜索引擎论文 >

资源稀缺蒙语语音识别研究

发布时间:2018-03-29 10:31

  本文选题:资源稀缺 切入点:多语言深度神经网络 出处:《计算机科学》2017年10期


【摘要】:随着语音识别技术的发展,资源稀缺语言的语音识别系统的研究吸引了更广泛的关注。以蒙语为目标识别语言,研究了在资源稀缺的情况下(如仅有10小时的带标注的语音)如何利用其他多语言信息提高识别系统的性能。借助基于多语言深度神经网络的跨语言迁移学习和基于多语言深度Bottleneck神经网络的抽取特征可以获得更具有区分度的声学模型。通过搜索引擎以及网络爬虫的定向抓取获得大量的网页数据,有助于获得文本数据,以增强语言模型的性能。融合多个不同识别结果以进一步提高识别精度。与基线系统相比,多种系统融合的识别绝对错误率减少12%。
[Abstract]:With the development of speech recognition technology, the research of speech recognition system with scarce resources has attracted more and more attention. This paper studies how to use other multilingual information to improve the performance of recognition system under the condition of scarcity of resources (such as only 10 hours of tagged speech). Extracting features based on multilingual depth Bottleneck neural network can obtain a more discriminative acoustic model, and a large amount of web data can be obtained by searching engine and web crawler's directional crawling. It is helpful to obtain text data to enhance the performance of the language model, and to fuse multiple different recognition results to further improve the recognition accuracy. Compared with the baseline system, the recognition absolute error rate of multi-system fusion is reduced by 12 steps.
【作者单位】: 山东财经大学系统科学与信息处理研究所;
【基金】:国家自然科学基金(61305027) 山东省自然科学基金(ZR2011FQ024) 山东省高等学校科技计划(J17KB160)资助
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 吴军,,王作英;汉语信息熵和语言模型的复杂度[J];电子学报;1996年10期

2 金凌,吴文虎,郑方,吴根清;距离加权统计语言模型及其应用[J];中文信息学报;2001年06期

3 陈浪舟,黄泰翼,nlpr.ia.ac.cn;基于模糊训练集的领域相关统计语言模型[J];软件学报;2000年07期

4 刘长娥;王世镇;刘加;夏善红;;语种确认中基于段长的语言模型修正方法[J];计算机应用研究;2006年07期

5 张瑞强,王作英,陆大 ;关于汉语音字转换中语言模型零概率的问题[J];电子学报;1998年08期

6 沈兆勇;顾明亮;;基于符号化和语言模型方法的汉语方言自动辨识[J];徐州师范大学学报(自然科学版);2006年02期

7 杨春风;王欢良;;触发式语言模型下的混淆网络解码方法[J];计算机工程与应用;2011年10期

8 田斌;田红心;易克初;;一种结合声学匹配信息的汉语统计语言模型新方法[J];模式识别与人工智能;1999年04期

9 单煜翔;陈谐;史永哲;刘加;;基于扩展N元文法模型的快速语言模型预测算法[J];自动化学报;2012年10期

10 黎亚雄;张坚强;潘登;胡惮;;基于RNN-RBM语言模型的语音识别研究[J];计算机研究与发展;2014年09期

相关会议论文 前6条

1 陈振标;徐波;;限定领域的语言模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

2 田斌;易克初;;一种扩展的汉语统计二元文法语言模型[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年

3 苏韬;汪俊杰;孙甲松;王作英;;基于最大似然估计的语言模型自适应[A];第六届全国人机语音通讯学术会议论文集[C];2001年

4 宋彦;徐兵;付强;戴礼荣;;一种基于GMM模型的自动语种识别方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年

5 吴宗宪;王骏发;;语音辨认中阶层式以文法为主之马可夫语言模型[A];第三届全国人机语音通讯学术会议论文集[C];1994年

6 黄顺珍;方棣棠;;基于拼音模型的声学层的实验研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年

相关重要报纸文章 前1条

1 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年

相关硕士学位论文 前5条

1 张剑;连续语音识别中的循环神经网络语言模型技术研究[D];解放军信息工程大学;2014年

2 王贺福;统计语言模型应用与研究[D];复旦大学;2012年

3 秦敏;基于词激活力的长距离语言模型研究[D];北京邮电大学;2014年

4 李照耀;藏语连续语音识别的语言模型研究[D];西北民族大学;2014年

5 刘章;面向服务机器人的口语对话系统和语言模型技术研究[D];中国科学技术大学;2014年



本文编号:1680743

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1680743.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5a7cb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com