复杂环境下语音增强算法研究与实现
【图文】:
主观评价的优点主要是直接明了、便于理解。缺点是周期长、成本较高、灵活性差、重复性低、稳定性弱。本文主要介绍常见的主观评价方法:语谱图、评价意见得分。(1)语谱图语谱图是语音信号功率谱随时间 t变化的图形显示:S n, ω X n, ω (2.33其中,S n, ω 表示时间的“功率谱密度”, X n, ω 表示语音信号x n 的 STFT语谱图描述了语音信号随着时间 t在频谱上的相对能量分布,,所以其能够较好地反映语音信号的时变特征。在语谱图中,其水平方向是时间轴,垂直方向是频率轴,图形的灰度或色调的深浅表示给定频率成分在给定时刻的强弱。语谱图综合了时域波形图和频谱图的优点,在图中可以很明显的观察出信号频谱的时变规律,它反映了语音信号的动态频谱特性。在语音信号分析中具有极其重要的实用价值,被称为可视语音。图 2.7 是采样率为 16KHz,内容为“中国天安门”语音段的时域波形图和语谱图。从图 2.7 可以看出,颜色越红,表示语音信号的能量越大,颜色越蓝,表示语音信号的能量越小。
29(d) 文献[51]中维纳滤波算法增强后的语音信号图3.5 信号处理前后的时域波形图和语谱图为进一步说明几种经典算法(GSC、TF-GSC、CTF-GSC)的性能,将其进行了比较分析。在复杂环境(同时含有相干性和非相干性两种噪声)下,在输入语音信号的分段信噪比为 5dB,混响时间为 0.94s,目标声源与麦克风阵列的垂直方偏角为 15。的实验条件下,图 3.6(a)、(b)分别为参考麦克风接收到的目标语音信号和带噪语音信号的时域波形图和语谱图。图 3.6(c)、(d)、(e)分别为带噪语音信号经过 GSC、TF-GSC、CTF-GSC 算法增强后的语音信号的时域波形图和语谱图。从图 3.6 中时域波形图的无语音段可以得知,CTF-GSC 语音增强算法对于相干性噪声的抑制效果要优于 GSC 和 TF-GSC 语音增强算法,其中 GSC语音增强算法效果最差。但这两种算法都残留着一些非相干噪声
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.35
【参考文献】
相关期刊论文 前6条
1 覃爱娜;戴亮;李飞;曹卫华;;基于改进小波阈值函数的语音增强算法研究[J];湖南大学学报(自然科学版);2015年04期
2 徐文超;王光艳;耿艳香;白芳;费腾;;基于谱减法和变步长LMS语音增强算法[J];计算机工程与应用;2015年01期
3 王冬霞;郑家超;范真维;周城旭;;混响环境下的宽带波束形成语音增强方法[J];计算机工程与应用;2012年34期
4 徐岩;孟静;;基于粉红噪声的语音增强算法性能评价研究[J];铁道学报;2011年04期
5 丁猛;;基于麦克风阵列的语音增强算法概述[J];大众科技;2011年03期
6 陈国,胡修林,张蕴玉,朱耀庭;语音质量客观评价方法研究进展[J];电子学报;2001年04期
相关博士学位论文 前2条
1 张丽艳;复杂环境下麦克风阵列语音增强方法研究[D];大连理工大学;2009年
2 林静然;基于麦克风阵列的语音增强算法研究[D];电子科技大学;2007年
相关硕士学位论文 前10条
1 张蒙;室内环境下基于麦克风阵列的语音增强算法研究[D];深圳大学;2016年
2 张超;语音端点检测方法研究[D];大连理工大学;2016年
3 王艳芬;基于短时对数谱估计的语音增强算法研究[D];深圳大学;2015年
4 王永杰;基于麦克风阵列的语音增强算法研究[D];西安电子科技大学;2014年
5 吴秀芬;宽带阵列信号DOA估计方法研究[D];南京大学;2013年
6 李金涛;麦克风阵列语音增强算法研究[D];西安电子科技大学;2010年
7 武素芳;基于延迟—求和的麦克风阵列语音增强算法研究[D];西安电子科技大学;2010年
8 胡曙辉;麦克风阵列语音增强算法研究[D];西安电子科技大学;2009年
9 靳日飞;二维麦克风阵列语音增强算法研究[D];西安电子科技大学;2009年
10 苏先礼;语音去混响研究[D];四川大学;2006年
本文编号:2641252
本文链接:https://www.wllwen.com/kejilunwen/wltx/2641252.html