基于弹性网正则的稀疏先验多通道语音去混响
发布时间:2021-04-06 15:52
在室内和车内等声学环境密闭的地方,麦克风采集到的语音信号中会包含混响噪声。作为语音增强的一个重要组成部分,语音去混响算法可以为语音识别等技术进行预处理,去除语音信号中的混响噪声,提高语音信号的质量和可懂度。本文基于多通道线性预测(MCLP)语音去混响算法,做了如下几部分的研究:(1)分析了传统的加权预测误差(WPE)算法。传统的WPE算法是对期望的原始语音信号的短时傅里叶变换系数进行统计建模,发现其符合时变高斯模型,然后利用最大似然估计的方法求出期望语音信号。改进的算法是利用更能逼近真实语音信号的广义高斯分布先验概率模型来估计期望语音信号。本文研究改进型WPE算法发现,在利用最大似然估计法求未知参数时,对概率模型方差的估计不够准确。因此引入了非负矩阵分解方法,利用I-S散度求解非负矩阵分解优化的方差参数,从而提高了去混响效果。(2)根据原始语音信号的稀疏特性,利用稀疏重构的方法求解WPE算法中的预测滤波器系数。方法是将期望语音信号改写为稀疏表示模型,利用迭代加权最小二乘(IRLS)算法求解目标函数。本文研究了该算法的求解过程,发现如果麦克风矩阵比较紧密,会导致观测矩阵产生奇异值,降低稀...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图2.1室内混响过程示意图\??Fig.?2.1?Schematic?diagram?of?room?reverberation?process??
环境??中房间各表面反射系数/,进而求得仿真房间的房间冲激响应i??利用ISM仿真模型,本文搭建了一个仿真平台。在一个长4.5米,宽3.5米,高2.7??米的空旷矩形房间内,声源位置的坐标(1.25,1.75,1.5),麦克风位置的坐标(3.25,1.75,1.5)。??设置本仿真平台的混响时间通过式(2.9)可以求出仿真房间内各个表面的反??射系数通过式(2_8)即可求出仿真房间的房间冲激响应A(Z)。通过ISM仿真模型进行??仿真的混响时间/?7;=500ot房间冲激响应波形图如图2.2所示。??0.4?n?■????.???0.3??0.2??謹。I?VI?????02?|??-0.3?^??0?50?100?150?200?250??时间(毫秒)??图2.2房间冲激响应波形图??Fig.?2.2?Room?impulse?response?waveform??从图2.2中可以清晰地看出混响信号包括的三个部分:直达声、早期混响和晚期混??响。左侧延时最短、振幅最高的语音信号表示声源直接到达麦克风的直达声,直达声到??达麦克风以后、50ms之前到达麦克风的早期混响和50ms以后到达麦克风的晚期混响。??-10?-??
更具有严谨性。本文采用主观语音质量评估((Perceptual?Evaluation?of?Speech?Quality,??PESQ)和语音混响调制能量比(Speech-to-Reverberation?Modulation?Energy?Ratio,SRMR)??两种语音增强技术常用的客观评价指标。??(1)?PESQ??PESQ是由ITU-T(国际电信联盟电信标准化部)提出的-种可靠的客观MOS值评价??方法。.其评估流程为:首先输入原始语音信号作为参考信号,输入处理后的语音信号作??为待测信号。对参考信号和待测信号进行电平调整和短时傅里叶变换滤波的预处理。然??后将两路信号进行时间上的对齐处理。然后通过听觉转换处理,听觉转换处理是对系统??中线性滤波的补偿和均衡。然后通过扰动处理计算两路信号之间的差值。最后扰动处理??后的信号通过设计好的认知模型得出PESQ的评价值。若在扰动处理中出现坏的区间,??则需要对坏的区间再次进行时间上的对弁处理。PESQ评估的流程图如图2.10所示。??????I??????
【参考文献】:
期刊论文
[1]一种基于正交非负矩阵分解的多通道线性预测语音去混响方法[J]. 何冲,王冬霞,王旭东,蒋茂松. 声学技术. 2018(05)
[2]基于反幂法和卡尔曼滤波的自适应语音去混响方法[J]. 梅铁民. 信号处理. 2018(07)
[3]语音去混响技术的研究进展与展望[J]. 张雄伟,李轶南,郑昌艳,曹铁勇,孙蒙,闵刚. 数据采集与处理. 2017(06)
[4]融合解析模型和综合模型的压缩感知算法[J]. 练秋生,韩敏,石保顺,陈书贞. 电子学报. 2016(03)
[5]混响效应与去混响方法[J]. 曲万春,梅铁民. 自动化与仪器仪表. 2015(06)
[6]Gammatone滤波器修正的多级线性预测去混响[J]. 赵红,李双田. 信号处理. 2014(09)
[7]改进的多级线性预测晚期混响抑制算法[J]. 赵红,李双田. 信号处理. 2014(06)
[8]基于最小相位分解的语音去混响[J]. 廖启鹏,孔荣,沈圆圆,顾济华,赵鹤鸣,陶智. 通信技术. 2011(06)
[9]压缩传感理论与重构算法[J]. 杨海蓉,张成,丁大为,韦穗. 电子学报. 2011(01)
[10]单通道的语音盲去混响[J]. 沈希忠,孟光. 上海交通大学学报. 2010(02)
博士论文
[1]基于深度神经网络的语音去混响方法研究[D]. 吴渤.西安电子科技大学 2018
硕士论文
[1]单麦克风语音去混响算法研究[D]. 李玉.西安电子科技大学 2018
[2]基于EM的多通道去混响和降噪算法的改进[D]. 韩柳.中国科学技术大学 2018
[3]求解弹性网络模型的广义ADMM算法的研究[D]. 侯倩.华中科技大学 2018
[4]基于NMF的MCLP语音去混响方法研究[D]. 何冲.辽宁工业大学 2018
[5]语音信号去混响技术研究[D]. 牛莉莉.兰州交通大学 2017
[6]基于Cosparse解析模型的压缩感知算法及其应用研究[D]. 韩敏.燕山大学 2015
[7]房间混响消除的方法研究[D]. 行鹏程.沈阳理工大学 2013
[8]基于Gammatone听觉滤波器组和复倒谱盲解卷积的语音去混响研究[D]. 廖启鹏.苏州大学 2012
[9]语音去混响研究[D]. 苏先礼.四川大学 2006
本文编号:3121701
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图2.1室内混响过程示意图\??Fig.?2.1?Schematic?diagram?of?room?reverberation?process??
环境??中房间各表面反射系数/,进而求得仿真房间的房间冲激响应i??利用ISM仿真模型,本文搭建了一个仿真平台。在一个长4.5米,宽3.5米,高2.7??米的空旷矩形房间内,声源位置的坐标(1.25,1.75,1.5),麦克风位置的坐标(3.25,1.75,1.5)。??设置本仿真平台的混响时间通过式(2.9)可以求出仿真房间内各个表面的反??射系数通过式(2_8)即可求出仿真房间的房间冲激响应A(Z)。通过ISM仿真模型进行??仿真的混响时间/?7;=500ot房间冲激响应波形图如图2.2所示。??0.4?n?■????.???0.3??0.2??謹。I?VI?????02?|??-0.3?^??0?50?100?150?200?250??时间(毫秒)??图2.2房间冲激响应波形图??Fig.?2.2?Room?impulse?response?waveform??从图2.2中可以清晰地看出混响信号包括的三个部分:直达声、早期混响和晚期混??响。左侧延时最短、振幅最高的语音信号表示声源直接到达麦克风的直达声,直达声到??达麦克风以后、50ms之前到达麦克风的早期混响和50ms以后到达麦克风的晚期混响。??-10?-??
更具有严谨性。本文采用主观语音质量评估((Perceptual?Evaluation?of?Speech?Quality,??PESQ)和语音混响调制能量比(Speech-to-Reverberation?Modulation?Energy?Ratio,SRMR)??两种语音增强技术常用的客观评价指标。??(1)?PESQ??PESQ是由ITU-T(国际电信联盟电信标准化部)提出的-种可靠的客观MOS值评价??方法。.其评估流程为:首先输入原始语音信号作为参考信号,输入处理后的语音信号作??为待测信号。对参考信号和待测信号进行电平调整和短时傅里叶变换滤波的预处理。然??后将两路信号进行时间上的对齐处理。然后通过听觉转换处理,听觉转换处理是对系统??中线性滤波的补偿和均衡。然后通过扰动处理计算两路信号之间的差值。最后扰动处理??后的信号通过设计好的认知模型得出PESQ的评价值。若在扰动处理中出现坏的区间,??则需要对坏的区间再次进行时间上的对弁处理。PESQ评估的流程图如图2.10所示。??????I??????
【参考文献】:
期刊论文
[1]一种基于正交非负矩阵分解的多通道线性预测语音去混响方法[J]. 何冲,王冬霞,王旭东,蒋茂松. 声学技术. 2018(05)
[2]基于反幂法和卡尔曼滤波的自适应语音去混响方法[J]. 梅铁民. 信号处理. 2018(07)
[3]语音去混响技术的研究进展与展望[J]. 张雄伟,李轶南,郑昌艳,曹铁勇,孙蒙,闵刚. 数据采集与处理. 2017(06)
[4]融合解析模型和综合模型的压缩感知算法[J]. 练秋生,韩敏,石保顺,陈书贞. 电子学报. 2016(03)
[5]混响效应与去混响方法[J]. 曲万春,梅铁民. 自动化与仪器仪表. 2015(06)
[6]Gammatone滤波器修正的多级线性预测去混响[J]. 赵红,李双田. 信号处理. 2014(09)
[7]改进的多级线性预测晚期混响抑制算法[J]. 赵红,李双田. 信号处理. 2014(06)
[8]基于最小相位分解的语音去混响[J]. 廖启鹏,孔荣,沈圆圆,顾济华,赵鹤鸣,陶智. 通信技术. 2011(06)
[9]压缩传感理论与重构算法[J]. 杨海蓉,张成,丁大为,韦穗. 电子学报. 2011(01)
[10]单通道的语音盲去混响[J]. 沈希忠,孟光. 上海交通大学学报. 2010(02)
博士论文
[1]基于深度神经网络的语音去混响方法研究[D]. 吴渤.西安电子科技大学 2018
硕士论文
[1]单麦克风语音去混响算法研究[D]. 李玉.西安电子科技大学 2018
[2]基于EM的多通道去混响和降噪算法的改进[D]. 韩柳.中国科学技术大学 2018
[3]求解弹性网络模型的广义ADMM算法的研究[D]. 侯倩.华中科技大学 2018
[4]基于NMF的MCLP语音去混响方法研究[D]. 何冲.辽宁工业大学 2018
[5]语音信号去混响技术研究[D]. 牛莉莉.兰州交通大学 2017
[6]基于Cosparse解析模型的压缩感知算法及其应用研究[D]. 韩敏.燕山大学 2015
[7]房间混响消除的方法研究[D]. 行鹏程.沈阳理工大学 2013
[8]基于Gammatone听觉滤波器组和复倒谱盲解卷积的语音去混响研究[D]. 廖启鹏.苏州大学 2012
[9]语音去混响研究[D]. 苏先礼.四川大学 2006
本文编号:3121701
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3121701.html