稀疏表示及区分性联合字典学习语音降噪算法
发布时间:2021-01-26 13:49
经过传统的联合字典学习算法所训练出来的语音字典会与相同算法下训练出来的噪声字典之间形成相互干扰,残留的噪声以及波形失真都是降噪之后的语音容易产生的问题.针对这一问题,提出一种新的算法,其基于稀疏表示及区分性联合字典学习.为确保信号能够在其对应子字典上进行正确稀疏表示,在字典的学习阶段,这个算法添加了字典区分约束项.最后利用基于区分性联合字典得到的稀疏表示系数对纯净语音进行估计,有效避免了语音失真,获得了更好的语音降噪效果.相比于传统算法,实验结果表明,所提算法在两种评测方式下均获得了最优的评价结果.
【文章来源】:小型微型计算机系统. 2020,41(05)北大核心
【文章页数】:5 页
【部分图文】:
平均表示误差
图1 平均表示误差实验结果表明,两种算法都具有优越的性能,大约经过15次迭代,两种算法就都能让原始字典中的大多数原子恢复,随着迭代次数的增加,这两种算法下的平均表示误差均呈现递减的趋势,并最终都保持在0.1以下.从整个迭代过程来看,D-Sparse K-SVD算法的相对误差和收敛速度都优于K-SVD算法.
图3为本文提出的稀疏表示及区分性联合字典学习语音降噪算法的具体流程.首先,利用D-Sparse K-SVD算法得到初始字典D(0),在误差还未达到收敛条件或者迭代次数之前,持续进行稀疏分解与字典更新.在稀疏分解的过程中,重复稀疏分解和字典更新,直到误差达到收敛条件或迭代次数.LARC算法用于执行在先前迭代中由训练样本获得的字典的稀疏分解以获得稀疏系数,在字典更新中利用L-BFGS算法优化目标函数,得到更新后的联合字典D(由纯净语音字典DS和噪声字典DN组成).然后基于区分性联合字典D,采用LARC算法对带噪语音Y进行稀疏表示,得到稀疏系数矩阵C,C=[CS;CN].估计的纯净语音幅度谱可以用^S=DS×CS来表示,将得到的^S乘上带噪语音的相位,然后通过逆短时傅里叶变换恢复出纯净语音信号.
【参考文献】:
期刊论文
[1]改进谱减法语音增强研究[J]. 屈晓旭,李朝辉,娄景艺. 通信技术. 2017(09)
[2]基于自适应逼近残差的稀疏表示语音降噪方法[J]. 周伟力,贺前华,王亚楼,庞文丰. 电子与信息学报. 2017(02)
博士论文
[1]复杂场景下基于深度学习的鲁棒性语音识别的研究[D]. 屠彦辉.中国科学技术大学 2019
本文编号:3001223
【文章来源】:小型微型计算机系统. 2020,41(05)北大核心
【文章页数】:5 页
【部分图文】:
平均表示误差
图1 平均表示误差实验结果表明,两种算法都具有优越的性能,大约经过15次迭代,两种算法就都能让原始字典中的大多数原子恢复,随着迭代次数的增加,这两种算法下的平均表示误差均呈现递减的趋势,并最终都保持在0.1以下.从整个迭代过程来看,D-Sparse K-SVD算法的相对误差和收敛速度都优于K-SVD算法.
图3为本文提出的稀疏表示及区分性联合字典学习语音降噪算法的具体流程.首先,利用D-Sparse K-SVD算法得到初始字典D(0),在误差还未达到收敛条件或者迭代次数之前,持续进行稀疏分解与字典更新.在稀疏分解的过程中,重复稀疏分解和字典更新,直到误差达到收敛条件或迭代次数.LARC算法用于执行在先前迭代中由训练样本获得的字典的稀疏分解以获得稀疏系数,在字典更新中利用L-BFGS算法优化目标函数,得到更新后的联合字典D(由纯净语音字典DS和噪声字典DN组成).然后基于区分性联合字典D,采用LARC算法对带噪语音Y进行稀疏表示,得到稀疏系数矩阵C,C=[CS;CN].估计的纯净语音幅度谱可以用^S=DS×CS来表示,将得到的^S乘上带噪语音的相位,然后通过逆短时傅里叶变换恢复出纯净语音信号.
【参考文献】:
期刊论文
[1]改进谱减法语音增强研究[J]. 屈晓旭,李朝辉,娄景艺. 通信技术. 2017(09)
[2]基于自适应逼近残差的稀疏表示语音降噪方法[J]. 周伟力,贺前华,王亚楼,庞文丰. 电子与信息学报. 2017(02)
博士论文
[1]复杂场景下基于深度学习的鲁棒性语音识别的研究[D]. 屠彦辉.中国科学技术大学 2019
本文编号:3001223
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3001223.html