噪声环境下鲁棒语音识别技术的研究
发布时间:2024-02-28 18:31
语音交流是人类最方便的交流方式。随着科技的发展,以语音识别技术为核心的人机交互方式日益流行起来。经过六十多年的发展,语音识别技术已经有了极大的提升,在安静环境下,语音识别系统的性能接近人类水平,而在有噪声干扰的情况下,语音识别系统的识别准确率大打折扣。在噪声环境下提高语音识别系统的鲁棒性已经成为语音识别技术投入大规模使用的关键之一。本文主要针对噪声环境下语音识别系统性能下降的情况,使用语音增强算法对输入语音进行降噪处理,提升输入语音的质量以提高语音识别系统的鲁棒性。而传统意义上的语音增强算法会使语音产生畸变和失真,因此需要针对自动语音识别系统的特性对语音增强算法进行改进。本文主要的工作有:(1)研究了基于人耳听觉掩蔽效应和谐波恢复原理的改进维纳滤波算法。首先研究了人耳的听觉掩蔽效应,并对掩蔽阈值的求解方法进行了介绍,其次对最小值统计噪声估计(Minimum Stasistics,MS)算法和基于最小值约束的递归平均噪声估计方法(Minima-Controlled Recrsive Average,MCRA)进行了研究,然后提出改进方案,第一步,结合掩蔽阈值调整噪声能量谱的估计;第二步,...
【文章页数】:94 页
【学位级别】:硕士
【部分图文】:
本文编号:3913859
【文章页数】:94 页
【学位级别】:硕士
【部分图文】:
图1–3DNN,GMM系统在训练和测试的SNR失配时的性能下降Fig1–3PerformancedegradationofDNN,GMMsystemwhenSNRbetweentrainingandtestingmismatch
图1–3DNN,GMM系统在训练和测试的SNR失配时的性能下降erformancedegradationofDNN,GMMsystemwhenSNRbetweentrainingandtesti复杂场景、噪声环境下的鲁棒语音识别已经成为了语音识别领域....
图2-1语音信号产生原理图
11图2-1语音信号产生原理图为两种激励讨论,浊音激励和清音激
图2-7DNN-HMM声学模型示意图
图2-7DNN-HMM声学模型示意图介绍
图3-11kHz出人耳的掩蔽效应
图3-11kHz出人耳的掩蔽效应值计算能够应用到实际语音信号处理过程中去,那么必须求
本文编号:3913859
本文链接:https://www.wllwen.com/kejilunwen/wltx/3913859.html