基于最小均方差幅度谱估计器的语音增强算法研究与实现

发布时间：2018-04-22 03:28

本文选题：语音增强 + MMSE　；参考：《南京航空航天大学》2017年硕士论文

【摘要】：语音增强算法是语音信号处理领域的重要技术,旨在提高低信噪比环境中语音信号的质量和可懂度,为进一步处理语音打下基础。在较低信噪比或者高度不平稳噪声环境中,语音的质量和可懂度会急剧下降,导致人类或者机器无法很好的识别或者传输,所以提高语音信号的质量对于语音的处理十分重要,具有较高的研究意义和应用价值。本文在分析经典语音增强算法的基础上,重点对基于最小均方误差(Minimum Mean Square Error,MMSE)幅度谱估计器的语音增强算法进行了研究和改进,并使用MATLAB工具对算法性能进行了评估;最后,将该算法移植到DM642芯片上实现音频采集处理和播放,并对算法进行了定点优化,提升了其实时性。本文主要内容如下:1.分析了语音增强算法的研究现状和各类算法的优缺点,通过对比选择基于MMSE幅度谱估计的语音增强算法进行研究,指出该算法存在着先验信噪比估计不足、噪声估计误差较大、DSP实现实时性较差等问题。2.针对MMSE幅度谱估计器所使用判决引导(Decision Directed,DD)先验信噪比估计算法延迟较大的缺点,提出了新的基于熵值变化的DDBSE(DD Based on Single frequency Entropy,DDBSE)先验信噪比计算方法。该算法基于熵值变化,能够快速追踪语音的变化,从而改善DD算法的不足,为幅度估计器提供更精确的信噪比估计。3.针对噪声估计不足的问题,提出了基于无偏噪声估计(Unbiased MMSE)和语音活动检测(Voice Activity Detection,VAD)的新的噪声估计算法UMVAD。该算法能够减小噪声的过估计和欠估计,提供最小的中值估计均方误差。实验结果表明,DDBSE与UMVAD结合,能在分段信噪比和综合评分上取得较好的效果,特别适合于低信噪比和不平稳噪声环境中的语音增强。4.对VAD算法进行改进,提出了双阈值VAD判决方式,改进后统计VAD结合能量熵(Energy-Entropy,EE)特征和平均峰值点偏差(Mean-Delta,MD)特征,能够取得较为满意的整体命中率;同时,基于噪声分类思路,结合支持向量机(Supported Vector Machine,SVM)对算法中可调参数进行优化,并将噪声分类器结合到算法中,提出了具有环境意识的语音增强算法。5.在DSP芯片DM642上实现了本文的语音增强算法,设计了一个语音采集播放系统,并对浮点算法进行了定点化。相比于浮点型算法,本文所提的定点型算法取得了83%左右的处理速度提升,并且实现了音频信号的实时采集处理和播放,能够将处理一帧的时间限制在8毫秒左右。
[Abstract]:璇煶澧炲己绠楁硶鏄闊充俊鍙峰鐞嗛鍩熺殑閲嶈鎶，

本文编号：1785412

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1785412.html

上一篇：WSN中基于Mobile Agent的数据融合算法研究
下一篇：共享孔径超表面设计及其在提升波导缝隙天线辐射和散射性能中的应用

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|