当前位置:主页 > 科技论文 > 网络通信论文 >

复杂环境下基于语音增强的声源定位技术研究

发布时间:2020-11-05 12:35
   声源定位是涉及到人机交互、语音增强、数字信号处理等的重要技术,有广阔的应用前景。在实际应用中,噪声与混响的存在常常会导致定位的性能下降。因此,对复杂环境下的声源定位技术进行研究具有重要的理论意义和实际的工程价值。首先,本文对常用的广义互相关时延估计方法进行仿真分析验证。常用的广义互相关时延估计算法在噪声比较大的环境中的时延估计性能较差,不能得到精度较高的时延估计值,且受噪声的影响较大。因此,本文从麦克风接收语音信号降噪考虑对语音信号进行处理。语音信号的去噪声处理常用算法为语音增强算法。本文对语音增强常用算法进行研究比较,LMS自适应滤波算法具有较强的去噪声能力。因此,考虑对信号进行广义互相关前,先对语音信号进行自适应滤波去噪声处理,基于此提出一种基于LMS-PHAT的时延估计方法。仿真表明,该算法在噪声强度较大的情况下,可以获得精度较高的时延估计值。其次,实际环境中,特别是封闭的室内环境中,会存在混响的干扰,因此要考虑混响条件下语音信号的时延估计。鉴于此,本文首先分析K.Lebart和J.M.Boucher提出的谱减法去混响,并提出一种改进的谱减法去混响,即首先对功率谱密度估计值及混响功率谱密度估计值进行平均处理,求得增益因子,通过增益因子和平均幅度谱相乘求得谱减后的幅度谱,用谱减后的幅度谱结合相位谱进行IFFT变换,将频域还原到时域,得到去混响的语音信号。仿真表明,改进的谱减法去混响具有更好的混响抑制效果。因此,通过对混响信号的抑制,结合LMS-PHAT的时延估计方法,可以提高时延估计值的精度。最后,本文设计了五元麦克风阵列的几何模型,并构建了一个声源定位系统,该定位系统主要由五部分组成,分别是对声源信号的去混响处理,对去混响信号的去噪声处理,广义互相关时延估计,对源信号的位置估算以及目标距离及方位角的获取。对该定位系统在不同声源位置的定位结果进行实验及分析。实验结果表明,在室内环境中,该声源定位系统的定位精度更高。
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TN912.35
【部分图文】:

频谱,矩形窗,旁瓣峰值,三角窗


如图 2.1 所示,分别为矩形窗,三角窗,汉出,矩形窗的旁瓣峰值幅度为-13dB;三角窗的峰值幅度为-31dB;汉明窗的旁瓣峰值幅度为最小,主瓣宽度最窄,频谱泄漏最严重。而汉。因此在本文的语音信号预处理中选择汉明窗(a) 矩形窗频谱 形窗频谱矩 三角频谱窗0

示意图,理想模型,示意图,直达声


图 2.3 理想模型示意图2.3.2 混响模型在室内,麦克风接收到的为声源发出的直达声和非直达声混合在一起的声音。其中,非直达声是由于边界和物体的反射造成的,如图 2.4 所示,这种多径传播效应在麦克风接收信号中引入了回声和谱失真,称为混响。这可能会严重影响源信号,造成信号的质量和可懂度下降。图 2.4 混响模型示意图

示意图,直达声,示意图,模型


图 2.3 理想模型示意图风接收到的为声源发出的直达声和非直达声混由于边界和物体的反射造成的,如图 2.4 所示号中引入了回声和谱失真,称为混响。这可能可懂度下降。
【参考文献】

相关期刊论文 前10条

1 张雷岳;张兴敢;刘超;;麦克风阵列声源定位中时延估计的改进[J];南京大学学报(自然科学);2015年01期

2 张凤;高航;;自然语言处理技术在西方国家军事领域的应用现状[J];国防科技;2014年06期

3 张一闻;刘建平;张世全;;利用多点互相关值均值的实时声源定位算法[J];西安电子科技大学学报;2015年01期

4 陈欢;邱晓晖;;改进谱减法语音增强算法的研究[J];计算机技术与发展;2014年04期

5 李伟红;汤海兵;龚卫国;;公共场所异常声源定位中时延估计方法研究[J];仪器仪表学报;2012年04期

6 刘颖;刘建平;夏靖波;;基于最小熵值的麦克风阵列声源定位算法[J];计算机工程;2012年07期

7 黄苏雨;梁声灼;黄苏园;;语音增强方法综述[J];计算机与现代化;2007年03期

8 崔玮玮;曹志刚;魏建强;;声源定位中的时延估计技术[J];数据采集与处理;2007年01期

9 钱国青;赵鹤鸣;;基于改进谱减算法的语音增强新方法[J];计算机工程与应用;2005年35期

10 林志斌,徐柏龄;基于传声器阵列的声源定位[J];电声技术;2004年05期


相关博士学位论文 前2条

1 孙昊;基于声达时间差的移动机器人声源目标定位方法研究[D];河北工业大学;2012年

2 张丽艳;复杂环境下麦克风阵列语音增强方法研究[D];大连理工大学;2009年


相关硕士学位论文 前8条

1 董鹤;噪声环境下基于谱减法的语音识别研究[D];哈尔滨工程大学;2016年

2 肖骏;基于麦克风阵列的实时声源定位技术研究[D];电子科技大学;2015年

3 姚培洋;基于麦克风阵列的声源定位算法研究及装置实现[D];东北大学;2013年

4 宗志亚;基于麦克风阵列的室内声源定位方法研究[D];重庆大学;2012年

5 王辛远;强干扰环境中语音增强技术研究[D];西安电子科技大学;2010年

6 周峰;室内麦克风阵列声源定位算法研究和实现[D];复旦大学;2009年

7 潘汉怀;近场麦克风阵列波束形成方法研究[D];电子科技大学;2007年

8 郭俊成;基于传声器阵列的声源定位技术研究[D];南京航空航天大学;2007年



本文编号:2871647

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2871647.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4d96d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com