基于稀疏表示与联合字典学习的语音增强

发布时间：2020-12-09 11:19

　　语音是人类进行语言交流与信息传播的重要媒介。然而,在现实生活中,语音信号不可避免地会被各种类型的噪声所污染。被污染的语音严重影响了语音交流的质量,同时还会使人产生听觉厌恶和疲劳。因此,研究有效的语音增强技术显得尤为重要。语音增强目的是尽可能地抑制和消除被污染语音中的噪声,从而提高语音的清晰度和可懂度。传统的语音增强算法在平稳噪声环境下能取得较好的性能,而对非平稳噪声和类人声噪声的抑制能力有限。而现实生活中,非平稳噪声是普遍存在的,本文基于稀疏表示和字典学习理论,提出一种改进的区分性联合字典学习方法以改善语音增强效果。本文首先介绍了一种联合字典的语音增强方法,该方法主要分为两个阶段,分别是字典学习阶段和语音增强阶段。在字典学习阶段,利用语音和噪声样本分别训练语音字典与噪声字典,并形成联合字典。在语音增强阶段,利用具有相干性终止准则的最小角回归算法,实现语音与噪声的分离。在仿真实验中,将该方法与传统的语音增强算法进行对比,并验证了该方法的有效性。上述联合字典方法没有考虑两类字典在表示语音样本和噪声样本的区分能力。在字典学习过程中单独地对每一类字典进行训练,不可避免地会导致各类字典之间存在较...

【文章来源】：苏州大学江苏省

【文章页数】：72 页

【学位级别】：硕士

【部分图文】：

基于稀疏表示与联合字典学习的语音增强

稀疏表示图示

对比图,字典,对比图,算法

平均表示误差

字典,算法,程度,原子

图 3-2 正确恢复原子的相对个数由于真实字典是已知的，那么就可以对估计的字典与原始字典的接近程度进上图 3-2 给出了恢复的原子数量图示。如果能从估计的字典中找到，与真的原子相匹配，使得，则认为该原子被恢复出来了。由以上两个实验可以看出，MOD算法和K-SVD算法的性能都非常好，采用2代，两算法就能恢复出原始字典中的大部分原子。并且，这两个算法都能够示误差降到 0.1 以下。在最终输出的误差以及收敛速度上来看，K-SVD 算法 MOD 算法。图 3-3 分别给出了采用 MOD 算法与 K-SVD 算法学习得到的字典的图形化。

【参考文献】：
期刊论文
[1]基于进化算法低信噪比环境的基音频率检测[J]. 张小恒,李勇明,谢文宾.  现代电子技术. 2017(11)
[2]一种新的基于稀疏表示的单通道盲源分离算法[J]. 田元荣,王星,周一鹏.  电子与信息学报. 2017(06)
[3]基于图像分解的稀疏去噪及优化方法研究[J]. 邹辉,吴奇峰,银壮辰,吴巍,明德烈.  计算机与数字工程. 2016(12)
[4]一种基于修正倒谱平滑技术改进的维纳滤波语音增强算法[J]. 李季碧,马永保,夏杰,刘金刚.  重庆邮电大学学报(自然科学版). 2016(04)
[5]基于发音特征的汉语声调建模方法及其在汉语语音识别中的应用[J]. 晁浩,杨占磊,刘文举.  计算机应用. 2013(10)
[6]基于谱减和LMS的自适应语音增强[J]. 姜占才,孙燕,王得芳.  计算机工程与应用. 2012(07)
[7]基于小波变换的语音数据压缩的研究[J]. 张玺君,王继曾,蔺莹.  科学技术与工程. 2009(02)
[8]基于多脉冲激励和卡尔曼滤波的语音增强算法[J]. 柳林,李辉,戴蓓蒨,陆伟.  数据采集与处理. 2009(01)

本文编号：2906787

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/2906787.html

上一篇：基于智能手机的可见光室内定位系统关键技术研究
下一篇：对脉冲多普勒雷达的航迹欺骗干扰技术研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|