当前位置:主页 > 科技论文 > 网络通信论文 >

复杂环境下语音增强算法研究与实现

发布时间:2020-04-26 07:24
【摘要】:随着科技的发展,语音增强在车载系统、电话视频会议、助听器、智能家电及人工智能等领域中具有重要的应用前景。在现实生活中,由于噪声的存在,语音信号会被不同的噪声干扰和污染,使得语音质量较差。所以,需要可以对含噪语音信号进行相应降噪处理。语音增强技术,能够抑制噪声的影响,改进语音质量,提高语音可懂度与清晰度。在含有多样性噪声源和环境混响的复杂环境下,采用麦克风阵列和语音增强相结合的技术,能够更好地降低噪声影响。本文基于复杂环境下,对语音增强算法进行了分析和研究,主要工作如下:(1)对广义旁瓣相消器(Generalized Sidelobe Canceller,GSC)语音增强算法进行了分析和研究。GSC语音增强算法是经典的波束形成算法,GSC结构简单,便于实现。(2)对传递函数广义旁瓣相消器(Transfer Function Generalized Sidelobe Canceller,TF-GSC)语音增强算法进行了分析和研究。TF-GSC语音增强算法在GSC语音增强算法的基础上,利用传递函数系数比重新构建阻塞矩阵和固定波束形成器,与GSC语音增强算法相比,TF-GSC语音增强算法提高了系统对声学环境的适应性。(3)对卷积传递函数广义旁瓣相消器(Convolutive Transfer Function Generalized Sidelobe Canceller,CTF-GSC)语音增强算法进行了研究和改进。CTF-GSC语音增强算法是以传统GSC语音增强算法为基础,用CTF近似形式代替TF-GSC语音增强算法中相乘传递函数(Multiplicative Transfer Function,MTF)近似形式,考虑不同频率之间的相互干扰,使用各个麦克风之间的相对传递函数的比例系数对阻塞矩阵和固定波束形成器进行新的构造,利用在频域的CTF形式建立了新的阵列信号传递函数模型。CTF近似形式比MTF近似形式估算更加的准确和更少的限制要求,进一步提高了降噪能力。CTF-GSC语音增强算法的自适应抵消器模块采用了固定步长归一化最小均方(Normalized Least Mean Square,NLMS)算法。改进的CTF-GSC语音增强算法则采用(Variable Step-size-NLMS,VSS-NLMS)算法来构建自适应抵消器模块。改进的VSS-NLMS算法可以进一步抑制输入语音对噪声的影响,使自适应抵消器模块具有更快的收敛性和更强的稳定性,从而使CTF-GSC语音增强算法能够更好地抑制噪声。(4)对基于维纳滤波的语音增强算法进行了较为深入的研究。传统的维纳滤波语音增强算法的主要原理是将期望语音信号和估计语音信号之间的均方误差最小化,从而得到较为纯净的语音信号。改进的维纳滤波语音增强算法在此基础上,引入了语音活性检测(Voice Activity Detection,VAD)算法和小波多窗口谱估计算法对噪声信号进行估计。改进后的算法语音信号中残留的噪声较少,系统降噪效果更佳。(5)对基于CTF-GSC和后置维纳滤波语音增强算法进行了分析和研究。一般情况下,CTF-GSC语音增强算法对于相干性噪声有良好的降噪效果,而维纳滤波算法对于非相干性噪声有显著的抑制效果。本文将这两种方法有效结合,提出了一种新的基于波束形成语音增强算法,该算法对于两种类型的噪声都有明显的降噪能力,并具有良好的鲁棒性。(6)在复杂环境下,对以上几种算法进行仿真分析、语音信号采集和传输实验测试。同时,搭建了实际的测试实验环境,对算法进行了实际模拟,并对实验结果进行了对比和分析。实验结果证明:本文所提出的优化算法切实提高了系统信噪比,降低了语音失真。在含有多噪声源和环境混响的复杂环境下,本文提出的算法具备更好的顽健性。
【图文】:

语谱图,语谱图,天安门,语音段


主观评价的优点主要是直接明了、便于理解。缺点是周期长、成本较高、灵活性差、重复性低、稳定性弱。本文主要介绍常见的主观评价方法:语谱图、评价意见得分。(1)语谱图语谱图是语音信号功率谱随时间 t变化的图形显示:S n, ω X n, ω (2.33其中,S n, ω 表示时间的“功率谱密度”, X n, ω 表示语音信号x n 的 STFT语谱图描述了语音信号随着时间 t在频谱上的相对能量分布,,所以其能够较好地反映语音信号的时变特征。在语谱图中,其水平方向是时间轴,垂直方向是频率轴,图形的灰度或色调的深浅表示给定频率成分在给定时刻的强弱。语谱图综合了时域波形图和频谱图的优点,在图中可以很明显的观察出信号频谱的时变规律,它反映了语音信号的动态频谱特性。在语音信号分析中具有极其重要的实用价值,被称为可视语音。图 2.7 是采样率为 16KHz,内容为“中国天安门”语音段的时域波形图和语谱图。从图 2.7 可以看出,颜色越红,表示语音信号的能量越大,颜色越蓝,表示语音信号的能量越小。

谱图,信号处理,谱图,语音增强


29(d) 文献[51]中维纳滤波算法增强后的语音信号图3.5 信号处理前后的时域波形图和语谱图为进一步说明几种经典算法(GSC、TF-GSC、CTF-GSC)的性能,将其进行了比较分析。在复杂环境(同时含有相干性和非相干性两种噪声)下,在输入语音信号的分段信噪比为 5dB,混响时间为 0.94s,目标声源与麦克风阵列的垂直方偏角为 15。的实验条件下,图 3.6(a)、(b)分别为参考麦克风接收到的目标语音信号和带噪语音信号的时域波形图和语谱图。图 3.6(c)、(d)、(e)分别为带噪语音信号经过 GSC、TF-GSC、CTF-GSC 算法增强后的语音信号的时域波形图和语谱图。从图 3.6 中时域波形图的无语音段可以得知,CTF-GSC 语音增强算法对于相干性噪声的抑制效果要优于 GSC 和 TF-GSC 语音增强算法,其中 GSC语音增强算法效果最差。但这两种算法都残留着一些非相干噪声
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.35

【参考文献】

相关期刊论文 前6条

1 覃爱娜;戴亮;李飞;曹卫华;;基于改进小波阈值函数的语音增强算法研究[J];湖南大学学报(自然科学版);2015年04期

2 徐文超;王光艳;耿艳香;白芳;费腾;;基于谱减法和变步长LMS语音增强算法[J];计算机工程与应用;2015年01期

3 王冬霞;郑家超;范真维;周城旭;;混响环境下的宽带波束形成语音增强方法[J];计算机工程与应用;2012年34期

4 徐岩;孟静;;基于粉红噪声的语音增强算法性能评价研究[J];铁道学报;2011年04期

5 丁猛;;基于麦克风阵列的语音增强算法概述[J];大众科技;2011年03期

6 陈国,胡修林,张蕴玉,朱耀庭;语音质量客观评价方法研究进展[J];电子学报;2001年04期

相关博士学位论文 前2条

1 张丽艳;复杂环境下麦克风阵列语音增强方法研究[D];大连理工大学;2009年

2 林静然;基于麦克风阵列的语音增强算法研究[D];电子科技大学;2007年

相关硕士学位论文 前10条

1 张蒙;室内环境下基于麦克风阵列的语音增强算法研究[D];深圳大学;2016年

2 张超;语音端点检测方法研究[D];大连理工大学;2016年

3 王艳芬;基于短时对数谱估计的语音增强算法研究[D];深圳大学;2015年

4 王永杰;基于麦克风阵列的语音增强算法研究[D];西安电子科技大学;2014年

5 吴秀芬;宽带阵列信号DOA估计方法研究[D];南京大学;2013年

6 李金涛;麦克风阵列语音增强算法研究[D];西安电子科技大学;2010年

7 武素芳;基于延迟—求和的麦克风阵列语音增强算法研究[D];西安电子科技大学;2010年

8 胡曙辉;麦克风阵列语音增强算法研究[D];西安电子科技大学;2009年

9 靳日飞;二维麦克风阵列语音增强算法研究[D];西安电子科技大学;2009年

10 苏先礼;语音去混响研究[D];四川大学;2006年



本文编号:2641252

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2641252.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户14f9e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com