基于最小均方差幅度谱估计器的语音增强算法研究与实现
发布时间:2018-04-22 03:28
本文选题:语音增强 + MMSE ; 参考:《南京航空航天大学》2017年硕士论文
【摘要】:语音增强算法是语音信号处理领域的重要技术,旨在提高低信噪比环境中语音信号的质量和可懂度,为进一步处理语音打下基础。在较低信噪比或者高度不平稳噪声环境中,语音的质量和可懂度会急剧下降,导致人类或者机器无法很好的识别或者传输,所以提高语音信号的质量对于语音的处理十分重要,具有较高的研究意义和应用价值。本文在分析经典语音增强算法的基础上,重点对基于最小均方误差(Minimum Mean Square Error,MMSE)幅度谱估计器的语音增强算法进行了研究和改进,并使用MATLAB工具对算法性能进行了评估;最后,将该算法移植到DM642芯片上实现音频采集处理和播放,并对算法进行了定点优化,提升了其实时性。本文主要内容如下:1.分析了语音增强算法的研究现状和各类算法的优缺点,通过对比选择基于MMSE幅度谱估计的语音增强算法进行研究,指出该算法存在着先验信噪比估计不足、噪声估计误差较大、DSP实现实时性较差等问题。2.针对MMSE幅度谱估计器所使用判决引导(Decision Directed,DD)先验信噪比估计算法延迟较大的缺点,提出了新的基于熵值变化的DDBSE(DD Based on Single frequency Entropy,DDBSE)先验信噪比计算方法。该算法基于熵值变化,能够快速追踪语音的变化,从而改善DD算法的不足,为幅度估计器提供更精确的信噪比估计。3.针对噪声估计不足的问题,提出了基于无偏噪声估计(Unbiased MMSE)和语音活动检测(Voice Activity Detection,VAD)的新的噪声估计算法UMVAD。该算法能够减小噪声的过估计和欠估计,提供最小的中值估计均方误差。实验结果表明,DDBSE与UMVAD结合,能在分段信噪比和综合评分上取得较好的效果,特别适合于低信噪比和不平稳噪声环境中的语音增强。4.对VAD算法进行改进,提出了双阈值VAD判决方式,改进后统计VAD结合能量熵(Energy-Entropy,EE)特征和平均峰值点偏差(Mean-Delta,MD)特征,能够取得较为满意的整体命中率;同时,基于噪声分类思路,结合支持向量机(Supported Vector Machine,SVM)对算法中可调参数进行优化,并将噪声分类器结合到算法中,提出了具有环境意识的语音增强算法。5.在DSP芯片DM642上实现了本文的语音增强算法,设计了一个语音采集播放系统,并对浮点算法进行了定点化。相比于浮点型算法,本文所提的定点型算法取得了83%左右的处理速度提升,并且实现了音频信号的实时采集处理和播放,能够将处理一帧的时间限制在8毫秒左右。
[Abstract]:璇煶澧炲己绠楁硶鏄闊充俊鍙峰鐞嗛鍩熺殑閲嶈鎶,
本文编号:1785412
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1785412.html