基于多模型矢量泰勒级数的语音识别系统优化
发布时间:2017-05-21 21:16
本文关键词:基于多模型矢量泰勒级数的语音识别系统优化,由笔耕文化传播整理发布。
【摘要】:在理想的实验室环境下,语音识别系统具有很高的识别率,但是在实际环境下,由于各种噪声的干扰,降低了实际应用环境下的语音识别性能,论文将从前端的端点检测和后端的拒识别两方面入手,进行系统优化,以提高语音识别系统性能、尤其是低信噪比环境下的识别性能。论文的主要工作包括:(1)分析了语音识别系统结构,包括预处理、特征提取和建模。预处理主要对语音信号进行预加重、分帧加窗、端点检测;提取美尔频率倒谱系数(MFCC:Mel-Frequency Cepstral Coefficients)及其一阶差分倒谱系数,作为语音识别系统的特征参数;利用隐马尔科夫模型(HMM:Hidden Markov Mod el)对语音信号进行声学建模。(2)实现了基于子带能量谱熵的端点检测算法,优化了系统的端点检测模块。子带能量谱熵参数不仅可以表征低信噪比环境下的语音信号特征,而且对不同种类的噪声有一定的鲁棒性。测试结果表明,在低信噪比环境下,基于子带能量谱熵的端点检测效果要优于原先的双门限端点检测:端点检测模块的优化大幅提高VTSME(VTS-based Multi-Environment)语音识别系统的识别性能,尤其是在低信噪比环境下的识别性能。(3)为语音识别系统增加了拒识模块。本文对语音长度过短、环境信噪比过低和对可能识别错误的孤立词进行拒识这三个方面进行研究,其中重点研究了基于后验概率差值的拒识算法。通过拒识噪声大、语音短和区分度低的测试语音,大幅度提高了系统识别准确率,而基本没有增加系统复杂度,保证了系统的实时性。(4)在MATLAB平台上进行的仿真实验基础上,实现了C平台的优化算法。将优化部分移植到C平台,完成了对实时的非特定人孤立词识别系统的优化。实验结果证明,优化使语音识别系统的识别性能得到了大幅度提升。
【关键词】:子带谱熵 端点检测 拒识 多环境模型
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要4-5
- Abstract5-8
- 第一章 绪论8-12
- 1.1 语音识别的研究背景8
- 1.2 语音识别的发展历史和现状8-9
- 1.2.1 国外发展历史和研究现状8-9
- 1.2.2 国内发展历史和研究现状9
- 1.3 语音识别技术的难点9-10
- 1.4 论文的主要内容及组织结构10-12
- 第二章 语音识别系统的优化概述12-24
- 2.1 语音识别系统的结构12-15
- 2.1.1 预处理12-13
- 2.1.2 特征提取13-14
- 2.1.3 HMM声学模型14-15
- 2.2 端点检测算法15-19
- 2.2.1 传统双门限端点检测算法16-17
- 2.2.2 基于互相关函数的端点检测算法17-18
- 2.2.3 基于谱熵的端点检测算法18-19
- 2.3 语音拒识算法19-23
- 2.3.1 基于填充模型和噪声模型的拒识算法20-21
- 2.3.2 基于后验概率差值的拒识算法21-23
- 2.4 小结23-24
- 第三章 多模型VTS孤立词识别系统的前端优化24-50
- 3.1 引言24-26
- 3.2 基于多环境模型VTS特征补偿算法概述26-28
- 3.2.1 基于VTS倒谱域特征补偿算法概述26
- 3.2.2 基于VTS特征补偿算法噪声均值方差估计26-27
- 3.2.3 多环境模型的VTS特征补偿算法概述27-28
- 3.3 基于子带谱熵的端点检测算法28-38
- 3.3.1 子带谱熵参数28-31
- 3.3.2 基于子带谱熵的改进端点检测算法31-37
- 3.3.3 端点检测及系统性能评价37-38
- 3.4 基于MATLAB的仿真实验38-43
- 3.4.1 实验条件38-39
- 3.4.2 实验结果及分析39-43
- 3.5 基于C平台的实时实验43-47
- 3.5.1 实时语音采集43-44
- 3.5.2 实验设备与数据库介绍44-45
- 3.5.3 实时测试方案45
- 3.5.4 实验结果与分析45-47
- 3.6 小结47-50
- 第四章 多模型VTS孤立词识别系统的后端优化50-68
- 4.1 基于后验概率差值的拒识算法50-55
- 4.1.1 拒识特征提取50-52
- 4.1.2 语音长度过短的拒识52-53
- 4.1.3 环境信噪比过低的拒识53
- 4.1.4 拒识步骤及算法流程53-54
- 4.1.5 拒识及系统性能评价54-55
- 4.2 基于MATLAB的仿真实验55-63
- 4.2.1 实验参数的选取55-56
- 4.2.2 实验结果及分析56-63
- 4.3 基于C平台的实时实验63-66
- 4.3.1 实验设备与数据库介绍63
- 4.3.2 实时测试方案63
- 4.3.3 实验结果与分析63-66
- 4.4 小结66-68
- 第五章 总结与展望68-70
- 5.1 全文总结68
- 5.2 研究展望68-70
- 致谢70-72
- 参考文献72-75
- 攻读硕士学位期间参加的科研项目和完成的论文75
【相似文献】
中国期刊全文数据库 前10条
1 汪洪波;;语音识别系统在配送中心的应用[J];信息与电脑;2006年06期
2 杨q,
本文编号:384869
本文链接:https://www.wllwen.com/kejilunwen/wltx/384869.html