基于稀疏表示的音频修复算法研究

发布时间：2017-10-18 20:45

本文关键词：基于稀疏表示的音频修复算法研究

【摘要】：在现实生活中,音频常常会因为环境噪声、网络拥塞和设备限幅等影响,而产生诸如脉冲干扰、片段丢失和削顶失真等情况的受损,降低音频的可听度和可懂度。如果音频应用于语音识别、说话人辨识等情况,还会导致相应识别率下降,所以需要对受损音频进行数字化修复,还原出受损部分,改善音频质量。针对目前音频修复的研究现状,本文采用基于稀疏表示的音频修复算法。基于稀疏表示的音频修复是指在音频为稀疏信号的前提下,利用受损音频中可靠部分的数据,在过完备字典中进行稀疏表示,然后用稀疏重建的方法来恢复出受损部分。因为音频中相邻帧之间信息存在着冗余,丢失的部分信息可以利用周围冗余信息来补全。算法分为过完备字典构造和稀疏表示两个环节。本文在前人工作的基础上,针对这两个环节进行了研究改进:1.过完备字典训练算法对于过完备字典构造,在之前的文献中采用固定字典,但是音频种类繁多,不同的音频具有不同的基频和共振峰等特征信息,因此固定字典不能很好的反映出特定音频的结构化特征,针对这一问题,本文采用训练的方法得到自适应字典,在选择字典训练算法时,为了兼顾算法的高效性和字典中原子的相关性,本文选用解耦合的K-SVD字典训练算法,即INK-SVD算法,来对音频进行训练。2.稀疏表示算法对于稀疏表示,在之前的文献中多使用OMP算法,这种算法不会选择重复的原子,稀疏表示误差小,但是,该算法并没有充分利用音频帧之间的相关性信息,即帧之间是存在很大程度上冗余的,本文通过实验的方法,证明相关性的存在,为了利用相关性信息,本文对传统的OMP算法进行改进,在选取原子的时候,考虑到该原子是否在前一帧用过,如果该原子被前一帧选中,则在下一帧中适当增加一个权重,权重的大小根据帧之间相关性动态调整,从而提高原子选取的精确性,降低计算误差的影响。本文实验部分是在Audio Inpainting Toolbox提供的音频数据集上,使用改进型基于OMP的音频修复算法对片段缺失、脉冲干扰、削顶失真等三类不同的受损情况,与传统的固定Gabor字典相比,改进算法在信噪比SNR有4-6dB提升,在主观评价指标PESQ上有0.2-0.3提升。
【关键词】：音频修复 稀疏表示 字典训练 INK-SVD OMP
【学位授予单位】：电子科技大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：TN912.3
【目录】：

摘要5-6
ABSTRACT6-10
第一章绪论10-15
1.1 研究背景及意义10-11
1.2 国内外研究现状和发展态势11-13
1.3 本文的主要工作13-14
1.4 论文的章节安排14-15
第二章音频修复和稀疏表示理论基础15-34
2.1 音频信号处理基本知识15-21
2.1.1 音频信号的基本概念15-18
2.1.2 音频信号的时频表示18-21
2.2 音频修复数学模型21-25
2.2.1 音频失真问题建模22-25
2.2.2 分帧和重建25
2.3 音频稀疏表示理论25-31
2.3.1 音频的稀疏表示26-27
2.3.2 过完备字典构造27-31
2.3.2.1 固定字典28-29
2.3.2.2 自适应字典29-31
2.4 音频信号修复效果的评价方法31-33
2.4.1 客观评价方法31-32
2.4.2 主观评价方法32-33
2.5 本章小结33-34
第三章改进型稀疏表示音频修复算法设计34-55
3.1 基于稀疏表示音频修复算法介绍34-36
3.2 INK-SVD算法介绍36-46
3.2.1 字典解耦合39-43
3.2.1.1 两个原子的解耦合40-41
3.2.1.2 多个原子的解耦合41-43
3.2.2 K-SVD算法43-46
3.3. 改进型OMP音频修复算法46-52
3.3.1 OMP算法46-47
3.3.2 改进型OMP算法47-52
3.4 音频修复原理分析52-54
3.4.1 对片段缺失的修复52
3.4.2 对脉冲噪声的修复52-53
3.4.3 对削顶失真的修复53-54
3.5 本章小结54-55
第四章改进型稀疏表示音频修复算法实现55-69
4.1 片段缺失的修复实验55-58
4.1.1 固定长度缺失片段的修复56-57
4.1.2 不同长度缺失片段的修复57-58
4.2 脉冲噪声的修复实验58-61
4.2.1 固定长度脉冲干扰的修复58-60
4.2.2 不同长度脉冲干扰的修复60-61
4.3 削顶失真的修复实验61-65
4.3.1 削顶等级固定的音频修复61-63
4.3.2 削顶等级不同条件下的修复63-64
4.3.3 不同约束条件下削顶失真的修复64-65
4.4 实验参数优化65-68
4.4.1 字典相关性阈值65-66
4.4.2 迭代次数66-67
4.4.3 帧移67
4.4.4 稀疏度67-68
4.5 本章小结68-69
第五章总结与展望69-71
5.1 总结69-70
5.2 展望70-71
致谢71-72
参考文献72-77

【参考文献】

中国期刊全文数据库前4条

1 汤红忠;张小刚;陈华;程炜;唐美玲;;带边界条件约束的非相干字典学习方法及其稀疏表示[J];自动化学报;2015年02期

2 李洋;李双田;;压缩感知下的稀疏表示语声恢复模型与算法[J];信号处理;2014年08期

3 邓峰;鲍长春;鲍枫;;基于核Fisher判别和加权码书映射的音频信号削波修复方法[J];数据采集与处理;2014年02期

4 刘春花;付强;杨家玮;颜永红;;音频信号截幅失真的检测与修复[J];声学技术;2009年04期

中国硕士学位论文全文数据库前3条

1 隋经纬;人工语音带宽扩展算法研究[D];大连理工大学;2014年

2 李占辉;基于小波变换的音频修复技术研究与实现[D];东华大学;2010年

3 刘春花;音频信号修复的算法研究[D];西安电子科技大学;2009年

，

本文编号：1057100

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1057100.html

上一篇：秦皇岛广播电视信号传输系统的整体规划设计研究
下一篇：旅客列车WIFI信号对车载设备的影响研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|