基于深度神经网络的蒙古文语音识别系统
发布时间:2017-09-11 12:11
本文关键词:基于深度神经网络的蒙古文语音识别系统
更多相关文章: RASR HMM 深度神经网络 语音自动识别
【摘要】:语音识别技术,也被称为自动语音识别(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。近年来,语音识别技术已经在各种大语种中全面展开,进入各个领域。比如随处可见的苹果中的siri系统。可惜高质量的语音服务中还未出现少数民族语言的相应语音服务。蒙古语语音识别的研究课题对于促进蒙古族语言文化的繁荣、发展和科技进步,以及中国少数民族语音信息处理的发展都具有重要的意义。目前有关语言和语音处理的公共可用的开源软件越来越多,而大多数的语音识别系统仅仅处理封闭的词汇表。但对于处理无限制语音输入的应用程序来说,即使再大的词汇表也无法覆盖所有的词汇。德国亚琛工业大学开发的开源语音识别工具(RWTH ASR,简称RASR),可将词汇表中的词单元组合起来合并成一个新词,从而在识别处理过程中识别外来词汇,完成大词汇量连续语音识别。本文介绍了语音识别技术的理论知识,并且通过德国亚琛工业大学开发的开源语音识别工具(RWTH ASR,简称RASR)开发大词汇量语音识别的声学模型和解码器。完成信号分析的配置,估计高斯混合模型和语音决策树,结合深度神经网络(Deep Neural Network, DNN)得到一个开放的词汇自动语音识别(Automatic Speech Recognition, ASR)系统。本文的主要工作是使用神经网络来对大量语音数据进行训练,并得到声学模型。同时详细介绍了怎样用RASR开源工具开发连续语音识别的过程,重点介绍训练和识别的配置和实现。
【关键词】:RASR HMM 深度神经网络 语音自动识别
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP183;TN912.34
【目录】:
- 摘要4-6
- ABSTRACT6-12
- 第一章 绪论12-15
- 1.1 语音识别概述与分类12-13
- 1.2 语音识别技术的发展历史13-14
- 1.2.1 语音识别技术在其他国家的发展13
- 1.2.2 语音识别技术在国外的发展13
- 1.2.3 蒙古语语音识别技术面临的挑战13-14
- 1.3 论文研究内容14-15
- 第二章 语音识别的基本原理15-24
- 2.1 语音识别本质15-16
- 2.1.1 声学模型15
- 2.1.2 语言模型15-16
- 2.1.3 词典16
- 2.1.4 解码器16
- 2.2 语音识别流程图16-17
- 2.3 隐马尔可夫模型基本原理17-20
- 2.4 HMM输出概率20
- 2.5 HMM参数估计20-22
- 2.6 语音解码和搜索算法22-23
- 2.7 本章小结23-24
- 第三章 神经网络模型24-32
- 3.1 神经网络概述24-26
- 3.1.1 神经网络的类型24
- 3.1.2 神经元24-25
- 3.1.3 多层感知器网络25-26
- 3.2 BP网络26-29
- 3.2.1 算法思想27
- 3.2.2 BP算法的步骤27-28
- 3.2.3 参数对BP算法的影响28-29
- 3.2.4 BP网络的优缺点29
- 3.3 深度学习思想29-31
- 3.3.1 深度学习的基本思想30
- 3.3.2 深度信念神经网络30-31
- 3.3.2.1 RBM31
- 3.3.2.2 DBN-DNN31
- 3.4 本章小结31-32
- 第四章 基于深度神经网络的蒙古文语音识别32-56
- 4.1 软件安装33-34
- 4.1.1 RWTH ASR 0.6.1安装33
- 4.1.2 SRI LM工具安装33-34
- 4.2 数据准备34-37
- 4.2.1 语料库文件34-35
- 4.2.2 字典文件35-36
- 4.2.3 计算统计36-37
- 4.3 特征提取37-41
- 4.3.1 流网络37-38
- 4.3.2 声学特征38-40
- 4.3.3 MFCC特征提取40-41
- 4.4 声学模型的训练41-45
- 4.4.1 单音素训练42-44
- 4.4.2 三音素训练44-45
- 4.5 训练神经网络45-49
- 4.5.1 Hybrid NN/HMM系统45-46
- 4.5.2 训练神经网络46-47
- 4.5.3 Tandem bottleneck系统47-49
- 4.6 语言模型训练49
- 4.7 解码和识别49-52
- 4.7.1 解码器49
- 4.7.2 识别过程49-52
- 4.8 实验结果52-55
- 4.8.1 AN4语料库识别52
- 4.8.2 Mongolian语料库识别52-53
- 4.8.3 实验结果分析53-55
- 4.9 本章小结55-56
- 第五章 总结与展望56-57
- 参考文献57-60
- 致谢60
【相似文献】
中国期刊全文数据库 前10条
1 汪洪波;;语音识别系统在配送中心的应用[J];信息与电脑;2006年06期
2 杨q,
本文编号:830632
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/830632.html