利用奇异谱分析的深度神经网络语音增强方法
发布时间:2021-07-30 13:06
针对现有深度神经网络语音增强方法对带噪语音的去噪能力有限、语音质量提升不高的问题,提出了一种基于奇异谱分析的深度神经网络语音增强方法。通过引入奇异谱分析算法对带噪语音进行预处理,以初步分离得到语音信号与噪声。接着将语音信号与噪声用于深度神经网络模型的训练,以得到性能更优的网络模型,从而使得本文方法具有更好的性能。最后在重建干净语音的环节中,同时使用神经网络估计得到的对数功率谱和带噪语音的对数功率谱,并加入了权重系数,使得本文提出的方法可以适应不同信噪比的情形,有效的去除背景噪声,降低语音信号的失真。本文通过仿真实验验证了该方法的有效性和鲁棒性。
【文章来源】:信号处理. 2020,36(06)北大核心CSCD
【文章页数】:9 页
【部分图文】:
信噪比为5 dB的带噪语音
图1(a) 信噪比为5 dB的带噪语音使用奇异谱分析算法将语音和噪声预分离之后,对全部分量进行短时傅里叶变换,得到幅度谱,平方后取对数得到对数功率谱。为后续的神经网络过程做准备。
本文提出的语音增强方法分为两阶段。图2为深度神经网络地训练阶段流程框图,神经网络通过拟合特征数据和标签数据完成监督学习,获得神经网络模型。在对带噪语音样本(Noisy samples)的特征提取时,首先需要对带噪语音样本进行奇异谱分析(SSA):
【参考文献】:
期刊论文
[1]基于深度神经网络的单通道语音增强方法回顾[J]. 鲍长春,项扬. 信号处理. 2019(12)
[2]利用深度全卷积编解码网络的单通道语音增强[J]. 时文华,张雄伟,邹霞,孙蒙. 信号处理. 2019(04)
本文编号:3311457
【文章来源】:信号处理. 2020,36(06)北大核心CSCD
【文章页数】:9 页
【部分图文】:
信噪比为5 dB的带噪语音
图1(a) 信噪比为5 dB的带噪语音使用奇异谱分析算法将语音和噪声预分离之后,对全部分量进行短时傅里叶变换,得到幅度谱,平方后取对数得到对数功率谱。为后续的神经网络过程做准备。
本文提出的语音增强方法分为两阶段。图2为深度神经网络地训练阶段流程框图,神经网络通过拟合特征数据和标签数据完成监督学习,获得神经网络模型。在对带噪语音样本(Noisy samples)的特征提取时,首先需要对带噪语音样本进行奇异谱分析(SSA):
【参考文献】:
期刊论文
[1]基于深度神经网络的单通道语音增强方法回顾[J]. 鲍长春,项扬. 信号处理. 2019(12)
[2]利用深度全卷积编解码网络的单通道语音增强[J]. 时文华,张雄伟,邹霞,孙蒙. 信号处理. 2019(04)
本文编号:3311457
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3311457.html