基于双层字典学习的单通道语音增强方法
发布时间:2021-06-06 18:15
为了提升复杂噪声环境下语音增强效果,该文提出了一种基于双层字典学习的单通道语音增强方法。在训练阶段首先采用干净语音和噪声训练初始化特征子字典,然后基于区分性约束和抗混淆约束的优化函数训练双层联合字典,第一层字典表达语音信号和噪声的可区分分量,而第二层字典表达语音信号和噪声的易混淆成分。在测试阶段含噪语音在双层联合字典上投影得到稀疏系数矩阵,然后重构得到增强后的语音。该方法利用目标优化函数的约束性减少"交叉投影"现象的发生,降低了信号在联合字典的混淆,从而进一步提升了语音增强的效果。实验结果表明,从语谱图、全局信噪比(SNR)、主观语音质量评估(PESQ)和对数频谱距离(LSD)四个方面评价,相比于基于稀疏约束非负矩阵分解和改进的维纳滤波的语音增强方法,该方法具有更好的性能,能够更有效地去除噪声。
【文章来源】:信号处理. 2020,36(06)北大核心CSCD
【文章页数】:12 页
【部分图文】:
图1 双层字典训练过程
基于双层联合字典的含噪语音信号增强模块
(4)为了更好的比较各种方法的语音增强效果,我们将从LSD值的大小来衡量本文算法增强后语音的失真度。LSD值越小表示增强后的语音信号的频谱失真越小,信号更接近干净语音,语音增强效果越好。图6(a)、(b)、(c)分别表示车载噪声、白噪声、机舱噪声下不同输入信噪比时各方法的LSD值的结果。可以看出相比于其他两种算法,本文算法在车载噪声、白噪声环境下都有更小的LSD值,增强后语音的失真度更小。在机舱噪声环境中,当信噪比为10 dB时,三种算法的LSD值较为接近,但DLSC算法的LSD值仍低于其他算法。因此,通过比较LSD值的大小表明,本文提出的DLSC算法在同一信噪比的噪声环境中可以更好地描述稀疏字典和系数矩阵的分布,能够更准确地还原出干净语音,具有更佳的增强效果。5 结论
【参考文献】:
期刊论文
[1]区分性联合稀疏字典交替优化的语音增强[J]. 贾海蓉,王卫梅,王雁,裴俊华. 西安电子科技大学学报. 2019(03)
[2]稀疏正则非负矩阵分解的语音增强算法[J]. 蒋茂松,王冬霞,牛芳琳,曹玉东. 计算机应用. 2018(04)
[3]改进小波阈值函数的语音增强算法研究[J]. 刘凤山,吕钊,张超,吴小培. 信号处理. 2016(02)
[4]改进的稀疏字典学习单通道语音增强算法[J]. 李轶南,张雄伟,曾理,黄建军. 信号处理. 2014(01)
[5]基于数据驱动字典和稀疏表示的语音增强[J]. 孙林慧,杨震. 信号处理. 2011(12)
硕士论文
[1]低信噪比环境下语音增强及相关技术研究[D]. 苏敏.南京邮电大学 2018
本文编号:3214896
【文章来源】:信号处理. 2020,36(06)北大核心CSCD
【文章页数】:12 页
【部分图文】:
图1 双层字典训练过程
基于双层联合字典的含噪语音信号增强模块
(4)为了更好的比较各种方法的语音增强效果,我们将从LSD值的大小来衡量本文算法增强后语音的失真度。LSD值越小表示增强后的语音信号的频谱失真越小,信号更接近干净语音,语音增强效果越好。图6(a)、(b)、(c)分别表示车载噪声、白噪声、机舱噪声下不同输入信噪比时各方法的LSD值的结果。可以看出相比于其他两种算法,本文算法在车载噪声、白噪声环境下都有更小的LSD值,增强后语音的失真度更小。在机舱噪声环境中,当信噪比为10 dB时,三种算法的LSD值较为接近,但DLSC算法的LSD值仍低于其他算法。因此,通过比较LSD值的大小表明,本文提出的DLSC算法在同一信噪比的噪声环境中可以更好地描述稀疏字典和系数矩阵的分布,能够更准确地还原出干净语音,具有更佳的增强效果。5 结论
【参考文献】:
期刊论文
[1]区分性联合稀疏字典交替优化的语音增强[J]. 贾海蓉,王卫梅,王雁,裴俊华. 西安电子科技大学学报. 2019(03)
[2]稀疏正则非负矩阵分解的语音增强算法[J]. 蒋茂松,王冬霞,牛芳琳,曹玉东. 计算机应用. 2018(04)
[3]改进小波阈值函数的语音增强算法研究[J]. 刘凤山,吕钊,张超,吴小培. 信号处理. 2016(02)
[4]改进的稀疏字典学习单通道语音增强算法[J]. 李轶南,张雄伟,曾理,黄建军. 信号处理. 2014(01)
[5]基于数据驱动字典和稀疏表示的语音增强[J]. 孙林慧,杨震. 信号处理. 2011(12)
硕士论文
[1]低信噪比环境下语音增强及相关技术研究[D]. 苏敏.南京邮电大学 2018
本文编号:3214896
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3214896.html