当前位置:主页 > 科技论文 > 信息工程论文 >

基于稀疏表示的语音盲解卷积和房间脉冲响应建模方法研究

发布时间:2021-07-04 06:12
  语音盲解卷积是语音信号处理领域极具挑战的研究课题之一。语音盲解卷积的目的是根据观测混响信号实现对源信号和声学信道的恢复,其意义不仅在于消除混响效应对自动语音识别、免提电话、助听器等应用的不利影响,同时通过所估计的声学信道还可以获得系统的声学特性,这对声学信道相关的声重放、语音增强等应用至关重要。然而,由于盲解卷积问题的非适定性,必须要为问题的求解提供一定的先验信息,如何获取这样的信息就成为问题求解的关键。本文研究了单输入单输出室内声学系统的语音盲解卷积问题,从挖掘和利用声学信道特性入手,围绕描述声学信道的房间脉冲响应展开工作,通过对房间脉冲响应施加正则约束和进行声学建模两种方式来获取先验信息,求解语音盲解卷积问题。本文主要研究内容如下:首先,研究了基于稀疏约束的语音盲解卷积问题。针对混响较低声学系统,提出了一种基于稀疏约束的语音盲解卷积模型,并给出了相应的求解方法。当混响较低时,房间脉冲响应可认为仅包含稀疏的前期反射部分。为此,所提模型采用了一个l1范数正则项对房间脉冲响应的稀疏特性进行约束;还采用了一个指示函数对源信号的动态范围进行约束,以进一步降低解空间维度。实验结果表明,所提方法... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:127 页

【学位级别】:博士

【部分图文】:

基于稀疏表示的语音盲解卷积和房间脉冲响应建模方法研究


图1-1封闭环境声音传播示例??Fig.?1-1?Illustration?of?sound?propagation?in?an?enclosed?environment??

房间脉冲响应,示例,前期反射


声#研宄的核心问题,具有极其重要的研宄价值。而本文工怍则是对源信号和房??间脉冲响应进行估计,以及房间脉冲响应建模的研宄。??图1-2给出了一个房间脉冲响应信号的缩略示例图,其中横坐标表示时间、纵??坐标表示脉冲信号在该时刻的幅值信息,该图反映了房间脉冲响应信号的幅值随??时间衰减变化的过程。房间脉冲响应通常可分为三部分:憲达声s前期反射和后期??反射(也称后期混响),它描述了声音由声源至麦克风的传播过程。当源信号与房??间脉冲响应这三部分进行卷积时分别产生接收信号的直达声.、前期混响和后期混??响。如图1-2所录,房间脉冲响应前期反射部分的各个脉冲之间具有较明显的时间??延迟,随时间建现分立排列;而后期反射部分则在时间上呈现较为密集的连续分??布。房间脉冲响应的反射能量随时间逐渐衰减,其描述了'声源停止发生后,声音不??断反射逐渐衰变的过程,通常情况下房间脉冲响应的反射能量M指数衰减?。需??要强调的是,很多时候房间脉冲响应的直达声和前期反射所组成的前期部分统称??为前期反射

房间脉冲响应,声学系统,缩略图,盲解卷


量和可理解性会因过大的后期反射而降低。通常在一些场景中,如静音室等经过??吸声处理的低反射声学环境,房间混响相对较低,则可认为房间脉冲响应仅包含相??对稀疏的前期反射部分(图2-1中红色虚线部分),而后期反射部分可以忽略不计,??则该种情况下的声学系统是稀疏的。因此,通过借助房间脉冲响应的稀疏性,可以??使用稀疏盲解卷积的方法实现语音信号和房间脉冲响应的估计。??本章对稀疏声学系统进行语音盲解卷积的研究,提出了一种基于稀疏约束的??语音盲解卷积模型。该模型不仅使用了声学系统的稀疏特性作为问题求解先验信??息,同时还使用了信号的动态范围以进一步降低盲解卷积解空间的范围。为了优??-13?-??

【参考文献】:
博士论文
[1]基于深度学习的说话人无关单通道语音分离[D]. 王燕南.中国科学技术大学 2017
[2]基于深层神经网络的语音增强方法研究[D]. 徐勇.中国科学技术大学 2015
[3]中国民族音乐厅堂ITDG和IACC的主观优选研究[D]. 郭天葵.华南理工大学 2013
[4]图像反卷积算法研究[D]. 杨航.吉林大学 2012
[5]双耳可听化质量及其影响因素的研究[D]. 饶丹.华南理工大学 2009



本文编号:3264203

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3264203.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6a111***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com