当前位置:主页 > 科技论文 > 信息工程论文 >

基于信号稀疏特性的语音增强算法研究

发布时间:2020-09-27 07:21
   语音增强是语音信号处理中的一个重要研究方向,在远程通信、助听设备、智能家电、人机交互以及智能会议系统中有着广泛的应用。语音增强算法一般利用干净信号与噪声在结构特性上的差异,采用数学方法将观测到含有噪声的语音信号变换到新的域。在这个新的域内,语音和噪声的区分性变得更加明显。具体而言,干净语音对应的系数往往是稀疏分布的,而噪声对应的系数则是随机分布的。因而只需简单的数学操作就可以实现语音和噪声的分离。然而现行的语音增强系统仍然有诸多问题没有解决。比如说,在很多算法中,噪声通常被假设为近似平稳的。这意味着与干净语音相比,噪声幅度的变化速度相对缓慢。在噪声不满足平稳性假设时,很多语音增强算法会面临性能损失,甚至会导致明显的语音失真。为此,研究者们提出将多个相同型号的麦克风按照一定形状组成麦克风阵列,进而发展出了丰富的多通道语音增强算法。此外,真实场景中往往还存在着混响和回声等,这给多通道语音增强算法带来严峻的考验。本文基于干净语音信号在不同变换域中体现的稀疏特性,提出了几种行之有效的语音增强算法,主要工作可以概括如下:首先,针对在时域呈现稀疏和非平稳特性,且在时间上随机分布、幅度任意大的冲击噪声,提出一个基于单通道的鲁棒的时频分解模型,将受噪声污染数据中的干净语音成分投影到一个离散余弦变换字典上,将冲击噪声投影到一个单位矩阵字典上。通过控制两组投影系数的稀疏度比例,并采用一种改进的正交匹配追踪算法,可以优化得到两种成分对应的稀疏投影矢量,进而实现对干净语音成分的重构。通过控制稀疏度的比例和重构误差的大小,可以控制语音失真和噪声残留之间的平衡,从而取得最佳的听觉效果。其次,针对在实际环境中存在的方向性、无方向噪声,提出对多通道音频数据流做并行化处理。采用一个固定长和宽的矩形窗口,在多通道音频流上按照一定的速度均匀滑动。在每个特定时刻,只针对窗口选取的数据矩阵的行、列作线性变换,从而实现空时协同滤波。我们采用迭代的方式分别更新时间滤波器矩阵和空间滤波器矩阵。基于最小均方误差准则,首先固定时间滤波器,更新空间滤波器;然后固定空间滤波器,更新时间滤波器;整个过程在两到三个循环即可收敛。最终,可以一次性得到对应所有通道的增强之后的语音数据。再次,为了充分利用多通道观测数据中携带的时间和空间信息,先对每个通道输出的音频数据流进行分帧,然后把这些帧重排为一个矩阵。更进一步,将对应于各通道音频流的矩阵堆叠成一个三阶张量,并设计三个滤波器(即帧内滤波器,帧间滤波器,空间滤波器),对该观测张量进行空时协同滤波。基于最小均方误差准则,采用一种循环迭代的方式交替更新三个滤波器,直到整个过程收敛。该方法可以一次性地估计得到所有通道内的干净语音数据。最后,基于上述三阶张量模型,我们提出将张量分解的方法用于多通道语音降噪。我们把含噪声的观测语音张量投影到设计好的正交基矩阵上,这包括通用基矩阵、有监督基矩阵、无监督基矩阵。通用基矩阵为三维离散余弦变换基矩阵,有监督基矩阵可以从预先提供的干净语音学习得到,无监督基矩阵则从含噪声的语音张量中自动推理获得。投影系数被包含在一个具有同样尺寸的核心张量内。根据最小化统计风险准则,可以设计出一种最佳的门限阈值;将核心张量中幅度低于该阈值的元素全部置零,即可实现噪声的抑制。
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TN912.35
【部分图文】:

过程图,字典,非负,鲸鱼


其短时傅里叶变换(Short-Term邋Fourier邋Transform,邋STFT)的幅度谱来表示[见图逡逑2.2(c)]。为了学习得到目标源的字典,我们使用了预先提供的对干净鲸鱼歌声逡逑的录音。图2.2(b)展示了我们学习得到的字典。可以看到,字典原子有效捕捉逡逑到了鲸鱼歌声中较为显著的频谱特征。重复同样的过程,我们可以通过背景噪逡逑声数据学习得到关于海杂波的较为显著的特征。一般而言,我们只需要几秒钟逡逑22逡逑I逡逑

基于信号稀疏特性的语音增强算法研究


图2.邋3邋DNN用于预测cIRM邋[71]逡逑26逡逑

波形,波形,基矩阵,唱片


或者这些模型的组合形式。基本的噪声类型包括高斯噪声(如电噪声等)、冲击逡逑噪声(如短时click等)。“高斯一冲击”混合噪声则有可能出现在VoIP系统和逡逑一些上世纪录制的老旧唱片中。图2.4展示了一段从78邋rpm老唱片上截取的波逡逑形。可以看到,该唱片存在大量稀疏分布的离群点,也就是冲击噪声。这给音逡逑频质量带来了较大的损伤,极大地降低了音乐爱好者对唱片的满意度。本节我逡逑们将介绍时频稀疏分解在数字语音修复中的具体应用m。逡逑2.邋5.邋1基于稀疏性的分离技术逡逑首先考虑最基本的信号分离模型。假设混合信号s由V邋s2eRixl两部分组逡逑成。考虑如下线性模型逡逑s邋=邋sI+s2+n.逦(2.66)逡逑此处n能量受限且服从零均值高斯分布,信号源81;邋s2分别可以被基矩阵逡逑A邋e邋和B邋e逦稀疏表示(A和&一般大于1邋)。不难有:逡逑s邋=邋Ax邋+邋By邋+邋n,逦(2.67)逡逑此处X和y分别为信号源S15邋82在基矩阵A、B上的稀疏投影矢量。一般而言,逡逑S和82的分离可以通过如下稀疏优化问题来解决:逡逑min邋||s-Ax-Byg邋+邋A'||x||0邋+/l'||y||0邋.逦(2.68)逡逑此处/。范数被用来计算投影矢量中的非零元素个数。通过把字典A、B拼接起逡逑来,上述问题可以转化为:逡逑呼1邋||S-Cz|丨+1’H。逦(2.69)逡逑27逡逑

【相似文献】

相关期刊论文 前10条

1 石玲;;基于计算机声卡的谱相减语音增强系统分析[J];信息与电脑(理论版);2010年02期

2 孙涛;;基于计算机声卡的谱相减语音增强系统分析[J];南昌教育学院学报;2010年05期

3 薛慧君;李盛;路国华;张杨;焦腾;王健琪;荆西京;;提升小波用于非接触语音增强算法的研究[J];医疗卫生装备;2013年05期

4 胡海波;刘柏森;许银;;基于小波变换的语音增强研究[J];黑龙江工程学院学报(自然科学版);2011年01期

5 任济生;任鹏;吉爱国;曹茂永;;基于小波变换的双通道相干语音增强[J];电子器件;2008年04期

6 ;Soata III:E1高密度回音消除和StudioSound级语音增强系统[J];通讯世界;2003年02期

7 董胡;钱盛友;;基于小波变换的语音增强方法研究[J];计算机工程与应用;2007年31期

8 柯健;徐志京;;基于生成对抗网络的语音增强算法研究[J];信息技术与网络安全;2018年05期

9 张小宇;刘云清;赵馨;;基于时域滤波多频段谱减法的语音增强[J];长春理工大学学报(自然科学版);2017年04期

10 屈赵燕;;基于盲源分离的单通道语音增强算法探究[J];产业与科技论坛;2016年03期

相关会议论文 前10条

1 王世伟;胡笑浒;郑成诗;李晓东;;一种改进的基于能量差语音增强算法[A];中国声学学会第九届青年学术会议论文集[C];2011年

2 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

3 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

4 童峰;许肖梅;洪青阳;;一种带阶数估计的语音增强算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

6 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

7 李海峰;韩纪庆;郑铁然;;元音、辅音粗判自适应电话语音增强方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

8 楼厦厦;郑成诗;李晓东;;滤波器权值约束对自适应零限波束形成语音增强算法鲁棒性影响分析[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年

9 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

10 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

相关重要报纸文章 前3条

1 ;NMS Sonata Ⅲ/Studio Sound级语音增强系统话音更清晰[N];中国计算机报;2003年

2 本报记者 马楠;NMS市场目标转向无线服务提供商[N];通信产业报;2001年

3 ;VoIP服务不只是便宜的通话[N];网络世界;2002年

相关博士学位论文 前10条

1 童仁杰;基于信号稀疏特性的语音增强算法研究[D];中国科学技术大学;2018年

2 王冬霞;麦克风阵列语音增强的若干方法研究[D];大连理工大学;2007年

3 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

4 孙琦;基于子空间的低计算复杂度语音增强算法研究[D];吉林大学;2017年

5 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

6 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

7 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年

8 刘威;单通道语音水印与语音增强算法研究[D];东南大学;2017年

9 章雒霏;基于机器学习的双麦克风手机语音增强算法研究[D];南京师范大学;2017年

10 江小平;舰载通信系统及其关键技术研究[D];华中科技大学;2007年

相关硕士学位论文 前10条

1 倪忠;基于麦克风阵列的语音增强方法研究[D];湖南大学;2017年

2 李瑞;多通道语音增强方法的研究[D];大连理工大学;2008年

3 郭俊欢;基于连续性约束的低秩稀疏分解语音增强方法研究[D];南昌航空大学;2018年

4 刘建青;多管阵列定向语音增强系统的研制[D];浙江大学;2012年

5 吴晓宇;VoIP系统中语音增强算法的研究与应用[D];北京邮电大学;2010年

6 芦靖;单通道语音增强算法的研究与应用[D];西安电子科技大学;2009年

7 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年

8 刘凤山;基于盲源分离的车载语音增强算法研究[D];安徽大学;2017年

9 郭栗;特定人语音增强算法的研究[D];上海交通大学;2015年

10 王琪;阵列语音增强算法的研究及实现[D];复旦大学;2008年



本文编号:2827586

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2827586.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户11675***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com