当前位置:主页 > 科技论文 > 信息工程论文 >

混响环境下的远程语音增强方法研究

发布时间:2020-04-15 08:00
【摘要】:语音是人与人沟通、人机交互的重要手段之一。在室内环境中除了噪声,由四壁和上下表面反射引起的混响是造成语音质量和可懂度下降的主要原因。期望信号与室内声学脉冲响应进行卷积,麦克风接收的信号为直达信号与混响成分的叠加。混响在时频域引起的拖尾,往往导致语音信号的包络和精细结构产生失真。同时噪声和潜在干扰的存在,以及语音自身的非平稳性使得室内语音增强问题更为复杂。本文将对室内环境下,麦克风采集的远程语音信号增强方法展开研究。考虑固定波束形成尤其是差分波束形成在室内时变声学环境中的局限性,在自适应波束形成的基础上,本文提出了基于传递函数广义旁瓣抵消器(Transfer Function-Generalized Sidelobe Canceller,TF-GSC)和改进极小值控制递归平均(Improved Minima Controlled Re-cursive Averaging,IMCRA)的远程语音增强框架,利用空-时联合处理方法对混响语音进行去混响和消噪,同时保证去混响方法在噪声存在下的稳健性。不以声源空间位置和声学传递函数信息为先验,本文将TF-GSC结构替换为多通道线性预测(Multichannel Linear Prediction,MCLP)盲去混响框架,介绍了最小绝对值和方法、基于组稀疏性假设的最小绝对值收缩和选择(Least Absolute Shrinkage and Selection Operator,LASSO)方法和基于最大化对数似然函数的归一化延迟线性预测方法。本文将IMCRA作为以上盲去混响方法的后置滤波器,讨论了非相干噪声对GSC和MCLP语音增强框架的影响。仿真和实验说明在混响占主导的室内环境下,多通道线性预测框架的语音增强性能优于GSC框架,后置滤波为两种语音增强框架的必要补充。本文设计搭建了一套多通道远程语音采集处理系统,实现实时语音数据的采集、处理和发送,同时以实录数据验证基于GSC和MCLP框架的远程语音增强方法的有效性。
【图文】:

流程图,语音处理,流程,语音增强


时保证算法稳健性。Kinoshita等人[8]从提交至REVERB邋Challenge的近三十篇文献中,,遴选逡逑出各类针对混响环境的语音增强识别算法,给出了由这些方法子集组成的混响语音处理流逡逑程,如图1邋-1所示。其中语音增强部分(Enhancement邋Part)作为识别部分(Recognition邋Part)逡逑的必要前级模块,包含多通道的语音增强和单通道语音增强/特征提取的子模块。REVERB逡逑Challenge提供纯净语音集和仿真数据集作为训练集,同时给出仿真和实录数据集作为各类逡逑语音增强算法的验证集。从图1-1中可以看到,语音增强部分的输出作为识别模块的前级,逡逑Enhancement邋part逦Recognition邋part逡逑逦A逦邋逦A逦逡逑(邋\(邋\逡逑^逦I邋i逦I邋i逦I邋i逦I邋逦逡逑r邋Multi-channel邋lchSE/FE.^邋Robust邋feature邋^逦^邋c0mbinat,0n邋f逡逑SE逦extraction逦3逦/逡逑^^邋^,逡逑AM邋LM逦/逡逑S邋/逡逑Adapt逦I逡逑LZ逦/逡逑图1-1邋REVERB邋Challenge去混响语音处理流程逡逑其性能的优劣直接影响后级中的稳健语音特征提取、译码模块以及最终的识别结果。因此,逡逑2逡逑

均匀分布,室内声学,常见方法,建模


.1邋愿逦(2-17)逡逑由于室内混响的复杂本质,对室内b8学的分析和合成需要不同的模型。图2-1给出了建模逡逑和仿真室内声学的常见方法,图内所示的建模方法可以划分为:波动(Wave-based)模型、逡逑射线(Ray-based)模型和统计模型,联合以上模型能够对全芦谱(Audio邋Spectrum)进行分逡逑析。然而对于语音信号的有限带宽性,准确而又简单的模型更为适用。逡逑2.3统计混响棋型逡逑在室内环境中对声学过程建模是一a极其复杂的过程,常用的方法为统计室内声学逡逑(SRA)。SRA利用房间体积!/、混响时间r6n、临界距离Dc、声源-麦克风距离等一系列参数逡逑绐出对声学系统传递函数的统计描述。为了描述单夂平面波的福度和相位分布,SRA基于逡逑的重要假设可以归结为:在室内任意一点产生的声压近似随机,因此声场均匀分布在整a逡逑12逡逑
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN912.35

【相似文献】

相关期刊论文 前10条

1 刘鹏;;基于深度学习的语音增强方法研究[J];智能计算机与应用;2019年05期

2 石玲;;基于计算机声卡的谱相减语音增强系统分析[J];信息与电脑(理论版);2010年02期

3 孙涛;;基于计算机声卡的谱相减语音增强系统分析[J];南昌教育学院学报;2010年05期

4 张晓雷;;基于深度学习的语音增强简述[J];网络新媒体技术;2019年02期

5 李璐君;屈丹;;一种基于组合深层模型的语音增强方法[J];信息工程大学学报;2018年04期

6 袁文浩;娄迎曦;梁春燕;夏斌;;利用生成噪声提高语音增强方法的泛化能力[J];电子学报;2019年04期

7 阴法明;唐於烽;;基于深度置信网络的语音增强算法[J];电子器件;2018年05期

8 余华;唐於烽;赵力;;基于改进深度置信网络的语音增强算法[J];数据采集与处理;2018年05期

9 薛慧君;李盛;路国华;张杨;焦腾;王健琪;荆西京;;提升小波用于非接触语音增强算法的研究[J];医疗卫生装备;2013年05期

10 胡海波;刘柏森;许银;;基于小波变换的语音增强研究[J];黑龙江工程学院学报(自然科学版);2011年01期

相关会议论文 前10条

1 王世伟;胡笑浒;郑成诗;李晓东;;一种改进的基于能量差语音增强算法[A];中国声学学会第九届青年学术会议论文集[C];2011年

2 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

3 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

4 童峰;许肖梅;洪青阳;;一种带阶数估计的语音增强算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

6 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

7 李海峰;韩纪庆;郑铁然;;元音、辅音粗判自适应电话语音增强方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

8 高登峰;杨波;郭东岳;;基于深度神经网络的地空通话语音增强方法[A];第一届空中交通管理系统技术学术年会论文集[C];2018年

9 楼厦厦;郑成诗;李晓东;;滤波器权值约束对自适应零限波束形成语音增强算法鲁棒性影响分析[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年

10 任玉宝;;基于联合字典学习的语音增强算法[A];中国声学学会水声学分会2019年学术会议论文集[C];2019年

相关重要报纸文章 前3条

1 ;NMS Sonata Ⅲ/Studio Sound级语音增强系统话音更清晰[N];中国计算机报;2003年

2 本报记者 马楠;NMS市场目标转向无线服务提供商[N];通信产业报;2001年

3 ;VoIP服务不只是便宜的通话[N];网络世界;2002年

相关博士学位论文 前10条

1 江文斌;面向复杂场景的极低码率语音编解码和语音增强关键技术研究[D];上海交通大学;2018年

2 高天;复杂环境下基于深度学习的语音信号预处理方法研究[D];中国科学技术大学;2018年

3 童仁杰;基于信号稀疏特性的语音增强算法研究[D];中国科学技术大学;2018年

4 王青;基于深层神经网络的多目标学习和融合的语音增强研究[D];中国科学技术大学;2018年

5 王冬霞;麦克风阵列语音增强的若干方法研究[D];大连理工大学;2007年

6 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

7 孙琦;基于子空间的低计算复杂度语音增强算法研究[D];吉林大学;2017年

8 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

9 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

10 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年

相关硕士学位论文 前10条

1 许瑞龙;基于自动编码器和生成对抗网络的语音增强方法研究[D];江西理工大学;2019年

2 续娇;基于自适应波束成形的语音增强算法研究与实现[D];北京交通大学;2019年

3 程泽丰;混响环境下的远程语音增强方法研究[D];浙江大学;2019年

4 黄张翼;基于深度神经网络的语音增强方法研究[D];重庆邮电大学;2018年

5 吴佳雯;基于表示学习的语音增强算法研究[D];厦门大学;2017年

6 曾帆;远距离麦克风阵列语音增强及系统实现[D];厦门大学;2018年

7 许铭;车载环境下语音处理关键技术的研究[D];辽宁工业大学;2019年

8 贾翔宇;基于张量模型的语音增强算法研究[D];中国科学技术大学;2019年

9 吉慧芳;改进相位谱信息及相位重构的语音增强算法研究[D];太原理工大学;2019年

10 王雁;基于深度神经网络的语音增强算法[D];太原理工大学;2019年



本文编号:2628325

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2628325.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户793b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com