基于稀疏表示的音频修复算法研究
发布时间:2017-10-18 20:45
本文关键词:基于稀疏表示的音频修复算法研究
更多相关文章: 音频修复 稀疏表示 字典训练 INK-SVD OMP
【摘要】:在现实生活中,音频常常会因为环境噪声、网络拥塞和设备限幅等影响,而产生诸如脉冲干扰、片段丢失和削顶失真等情况的受损,降低音频的可听度和可懂度。如果音频应用于语音识别、说话人辨识等情况,还会导致相应识别率下降,所以需要对受损音频进行数字化修复,还原出受损部分,改善音频质量。针对目前音频修复的研究现状,本文采用基于稀疏表示的音频修复算法。基于稀疏表示的音频修复是指在音频为稀疏信号的前提下,利用受损音频中可靠部分的数据,在过完备字典中进行稀疏表示,然后用稀疏重建的方法来恢复出受损部分。因为音频中相邻帧之间信息存在着冗余,丢失的部分信息可以利用周围冗余信息来补全。算法分为过完备字典构造和稀疏表示两个环节。本文在前人工作的基础上,针对这两个环节进行了研究改进:1.过完备字典训练算法对于过完备字典构造,在之前的文献中采用固定字典,但是音频种类繁多,不同的音频具有不同的基频和共振峰等特征信息,因此固定字典不能很好的反映出特定音频的结构化特征,针对这一问题,本文采用训练的方法得到自适应字典,在选择字典训练算法时,为了兼顾算法的高效性和字典中原子的相关性,本文选用解耦合的K-SVD字典训练算法,即INK-SVD算法,来对音频进行训练。2.稀疏表示算法对于稀疏表示,在之前的文献中多使用OMP算法,这种算法不会选择重复的原子,稀疏表示误差小,但是,该算法并没有充分利用音频帧之间的相关性信息,即帧之间是存在很大程度上冗余的,本文通过实验的方法,证明相关性的存在,为了利用相关性信息,本文对传统的OMP算法进行改进,在选取原子的时候,考虑到该原子是否在前一帧用过,如果该原子被前一帧选中,则在下一帧中适当增加一个权重,权重的大小根据帧之间相关性动态调整,从而提高原子选取的精确性,降低计算误差的影响。本文实验部分是在Audio Inpainting Toolbox提供的音频数据集上,使用改进型基于OMP的音频修复算法对片段缺失、脉冲干扰、削顶失真等三类不同的受损情况,与传统的固定Gabor字典相比,改进算法在信噪比SNR有4-6dB提升,在主观评价指标PESQ上有0.2-0.3提升。
【关键词】:音频修复 稀疏表示 字典训练 INK-SVD OMP
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 绪论10-15
- 1.1 研究背景及意义10-11
- 1.2 国内外研究现状和发展态势11-13
- 1.3 本文的主要工作13-14
- 1.4 论文的章节安排14-15
- 第二章 音频修复和稀疏表示理论基础15-34
- 2.1 音频信号处理基本知识15-21
- 2.1.1 音频信号的基本概念15-18
- 2.1.2 音频信号的时频表示18-21
- 2.2 音频修复数学模型21-25
- 2.2.1 音频失真问题建模22-25
- 2.2.2 分帧和重建25
- 2.3 音频稀疏表示理论25-31
- 2.3.1 音频的稀疏表示26-27
- 2.3.2 过完备字典构造27-31
- 2.3.2.1 固定字典28-29
- 2.3.2.2 自适应字典29-31
- 2.4 音频信号修复效果的评价方法31-33
- 2.4.1 客观评价方法31-32
- 2.4.2 主观评价方法32-33
- 2.5 本章小结33-34
- 第三章 改进型稀疏表示音频修复算法设计34-55
- 3.1 基于稀疏表示音频修复算法介绍34-36
- 3.2 INK-SVD算法介绍36-46
- 3.2.1 字典解耦合39-43
- 3.2.1.1 两个原子的解耦合40-41
- 3.2.1.2 多个原子的解耦合41-43
- 3.2.2 K-SVD算法43-46
- 3.3. 改进型OMP音频修复算法46-52
- 3.3.1 OMP算法46-47
- 3.3.2 改进型OMP算法47-52
- 3.4 音频修复原理分析52-54
- 3.4.1 对片段缺失的修复52
- 3.4.2 对脉冲噪声的修复52-53
- 3.4.3 对削顶失真的修复53-54
- 3.5 本章小结54-55
- 第四章 改进型稀疏表示音频修复算法实现55-69
- 4.1 片段缺失的修复实验55-58
- 4.1.1 固定长度缺失片段的修复56-57
- 4.1.2 不同长度缺失片段的修复57-58
- 4.2 脉冲噪声的修复实验58-61
- 4.2.1 固定长度脉冲干扰的修复58-60
- 4.2.2 不同长度脉冲干扰的修复60-61
- 4.3 削顶失真的修复实验61-65
- 4.3.1 削顶等级固定的音频修复61-63
- 4.3.2 削顶等级不同条件下的修复63-64
- 4.3.3 不同约束条件下削顶失真的修复64-65
- 4.4 实验参数优化65-68
- 4.4.1 字典相关性阈值65-66
- 4.4.2 迭代次数66-67
- 4.4.3 帧移67
- 4.4.4 稀疏度67-68
- 4.5 本章小结68-69
- 第五章 总结与展望69-71
- 5.1 总结69-70
- 5.2 展望70-71
- 致谢71-72
- 参考文献72-77
【参考文献】
中国期刊全文数据库 前4条
1 汤红忠;张小刚;陈华;程炜;唐美玲;;带边界条件约束的非相干字典学习方法及其稀疏表示[J];自动化学报;2015年02期
2 李洋;李双田;;压缩感知下的稀疏表示语声恢复模型与算法[J];信号处理;2014年08期
3 邓峰;鲍长春;鲍枫;;基于核Fisher判别和加权码书映射的音频信号削波修复方法[J];数据采集与处理;2014年02期
4 刘春花;付强;杨家玮;颜永红;;音频信号截幅失真的检测与修复[J];声学技术;2009年04期
中国硕士学位论文全文数据库 前3条
1 隋经纬;人工语音带宽扩展算法研究[D];大连理工大学;2014年
2 李占辉;基于小波变换的音频修复技术研究与实现[D];东华大学;2010年
3 刘春花;音频信号修复的算法研究[D];西安电子科技大学;2009年
,本文编号:1057100
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1057100.html