基于压缩感知的语音数字编码技术研究
发布时间:2017-04-25 18:07
本文关键词:基于压缩感知的语音数字编码技术研究,,由笔耕文化传播整理发布。
【摘要】:“大数据”(Big Data)时代的到来带来了飞速增长的信息量和信息处理任务。传统的奈奎斯特采样定理提出的最低采样速率在面对超宽带信号或冗余度较高的信号时,不仅在采样端处理任务复杂,而且在后续的存储和压缩时对系统资源造成了浪费。压缩感知技术近年来由于可以实现对信号在采样过程中同时压缩,受到信号处理领域的广泛关注。对于完整的数字语音处理系统而言,采样后的量化编码也是一个重要的环节。然而,目前压缩感知理论还处于研究的起步阶段,对压缩采样后的观测序列处理技术如编码的研究还很少涉及。压缩感知技术作为一种可以代替奈氏采样的信号采样技术,而编码是压缩感知从理论走向实际应用的必要前提。在这样的背景下,本文以压缩感知为基础,研究语音信号压缩感知观测序列的数字编码技术。论文的主要工作和创新点归纳如下:(1)经典的基于奈氏采样语音压缩编码技术中,基于模型的编码得到广泛应用。受到传统语音模型中正弦模型的启发,本文首先对一种利用正弦原子构造的字典和正交匹配追踪算法对语音压缩感知观测序列进行建模,对于每帧观测序列幅度、相位和频率三类参数,根据各类信号序列自身特点采用合适的编码方式进行编码,提高传输的效率。在解码端,利用解码后的参数合成观测序列。之后对其利用基追踪算法重构出合成语音信号,并后置低通滤波器提高合成语音的人耳听觉效果。仿真实验表明:该编码方案在实现对语音信号观测序列压缩编码的同时,主客观重构质量均可以得到保证。(2)利用压缩感知框架下行阶梯矩阵投影后观测序列可保留部分语音特性的特点,采用稀疏表示字典对观测序列进行数学建模的方法,设计了一种新型语音压缩感知编解码器。首先在训练阶段,先利用K奇异值分解方法对大量训练语音通过行阶梯投影后的观测序列进行训练,得到一个语音观测序列码本字典;然后在编码阶段,选取字典内的少量原子对实时语音观测序列建模,编码时仅对少量选择原子的位置和幅度进行编码并传输;解码端利用恢复后的观测序列和压缩感知重构算法恢复语音信号。通过仿真实验表明:基于稀疏表示的语音观测序列编码方案可有效的降低编码传输码率,并且保证良好的重构语音性能。
【关键词】:压缩感知 语音编解码 观测序列 行阶梯矩阵 正弦字典 稀疏表示
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要4-5
- Abstract5-9
- 专用术语注释表9-11
- 第一章 绪论11-18
- 1.1 压缩感知理论的发展情况11-13
- 1.2 语音编码发展及研究现状13-16
- 1.3 课题来源及研究内容16-17
- 1.4 本文的结构安排17-18
- 第二章 压缩感知理论与技术18-35
- 2.1 引言18
- 2.2 压缩感知基本理论18-24
- 2.2.1 数学模型18-20
- 2.2.2 信号的稀疏性20-21
- 2.2.3 观测矩阵设计21-22
- 2.2.4 重构算法22-24
- 2.3 语音信号CS系统框架24-34
- 2.3.1 观测矩阵选取及性能分析25-27
- 2.3.2 语音稀疏矩阵选取及仿真27-30
- 2.3.3 重构算法性能分析及仿真30-34
- 2.4 本章小结34-35
- 第三章 语音压缩感知正弦字典参数编码技术研究35-52
- 3.1 引言35-36
- 3.2 正弦模型和匹配追踪36-38
- 3.2.1 语音信号的正弦模型36-37
- 3.2.2 匹配追踪原理37-38
- 3.3 基于匹配追踪的观测序列正弦字典编码38-46
- 3.3.1 行阶梯观测序列分析38-40
- 3.3.2 基于匹配追踪和正弦字典的语音观测序列模型40-41
- 3.3.3 模型参数编码方案41-44
- 3.3.4 矢量量化和码本构造44-46
- 3.4 实验仿真与结果分析46-51
- 3.5 本章小结51-52
- 第四章 基于稀疏表示的语音压缩感知编码52-64
- 4.1 引言52
- 4.2 稀疏表示理论52-54
- 4.3 冗余字典简介54-56
- 4.3.1 基于调和分析的字典54-55
- 4.3.2 基于样本训练的字典55-56
- 4.4 稀疏表示在语音压缩感知编码中的应用56-60
- 4.5 实验仿真与结果分析60-63
- 4.6 本章小结63-64
- 第五章 总结与展望64-66
- 5.1 论文总结64
- 5.2 下一步研究方向64-66
- 参考文献66-70
- 附录1 攻读硕士学位期间撰写的论文70-71
- 附录2 攻读硕士学位期间申请的专利71-72
- 附录3 攻读硕士学位期间参加的科研项目72-73
- 致谢73
【相似文献】
中国期刊全文数据库 前3条
1 张政伟;樊养余;汪凯斌;;由单变量受扰观测序列估计混沌系统敏感参数[J];系统仿真学报;2007年14期
2 康健;宋元章;;利用多维观测序列的KCFM混合模型检测新型P2P botnet[J];武汉大学学报(信息科学版);2010年05期
3 ;[J];;年期
中国硕士学位论文全文数据库 前4条
1 李尚靖;基于压缩感知的语音数字编码技术研究[D];南京邮电大学;2015年
2 严菲;基于正交匹配追踪算法的压缩感知观测序列的正弦字典建模研究[D];南京邮电大学;2014年
3 郭海亮;基于GEP算法的压缩感知观测序列建模[D];陕西师范大学;2014年
4 朱俊华;压缩采样环境下的语音数字编码技术及量化噪声对信号重构影响的研究[D];南京邮电大学;2014年
本文关键词:基于压缩感知的语音数字编码技术研究,由笔耕文化传播整理发布。
本文编号:326787
本文链接:https://www.wllwen.com/kejilunwen/wltx/326787.html