基于梅尔频谱域HMM的语音增强方法研究

发布时间：2017-08-30 23:31

本文关键词：基于梅尔频谱域HMM的语音增强方法研究

【摘要】：传统的单通道语音增强算法虽然已经取得了很多进展,但是在应对现实生活中常见的非平稳噪声时,增强语音中往往会出现语音失真或者残留‖音乐噪声‖等问题。因此,如何在非平稳噪声环境下获得较好的增强语音成为实际应用中亟需解决的一项课题。本文利用梅尔频谱域的隐马尔可夫模型(Mel-Frequency Spectral domain Hidden Markov Model,MFS-HMM)提出了一套完整的语音增强方案。本文的研究工作包含如下三部分内容:第一,基于现有的MFS-HMM语音增强算法,提出了一种改进的基于MFS-HMM的语音增强算法。基于MFS-HMM的语音增强过程实质上是用加权滤波器对含噪语音进行滤波的过程。在改进算法中,本文先在梅尔频谱域和对数幅度域并行训练HMM,解决了由于滤波器估计不准确而带来频谱损失的问题。其次,本文将泰勒矢量级数(Vector Taylor Series,VTS)应用于含噪语音的HMM参数估计中,使得含噪语音的HMM参数与含噪语音更加匹配,从而使得加权滤波器更适用于含噪语音。HMM的并行训练和VTS的引入使得背景噪声得到有效抑制,大大提高了增强语音的主客观质量。第二,本文针对MFS-HMM语音增强算法中训练集和测试集能量不匹配问题,提出了一种基于能量调整的MFS-HMM语音增强算法。在该算法中,本文根据迭代期望最大(Expectation Maximization,EM)法在线调整纯净语音和噪声的对数谱能量,并在线修正纯净语音和噪声HMM的参数,使得训练集和测试集能量相匹配,有效地解决了能量不匹配对增强语音质量影响的问题,进一步提高了增强语音的主客观质量。最后,本文将所提语音增强算法应用到ITU-T G.718语音编码标准中的12kb/s编码器的前端。主客观质量测试结果均表明,所提方法优于G.718编码器中自带的语音增强方法,在噪声环境下,能获得较高质量的编码语音。
【关键词】：语音增强 隐马尔可夫模型 并行模式 泰勒矢量级数 能量调整
【学位授予单位】：北京工业大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.35
【目录】：

摘要5-6
Abstract6-9
第1章绪论9-17
1.1 课题背景9
1.2 国内外研究现状9-14
1.2.1 经典语音增强算法研究现状10-11
1.2.2 基于隐马尔可夫模型的语音增强算法研究现状11-14
1.3 研究目标14
1.4 研究内容14-15
1.5 论文结构15-17
第2章改进的基于MFS-HMM的语音增强算法17-47
2.1 隐马尔可夫模型17-25
2.1.1 Markov链17-19
2.1.2 HMM的定义及其与语音信号的关系19
2.1.3 HMM的基本元素19-20
2.1.4 HMM的基本算法20-25
2.2 现有的基于MFS-HMM的语音增强算法25-31
2.2.1 训练参数提取25-27
2.2.2 MFS-HMM27-29
2.2.3 信号模型29
2.2.4 含噪语音的HMM参数估计算法29-31
2.2.5 在线语音增强过程31
2.3 改进的基于MFS-HMM的语音增强算法原理31-35
2.3.1 基于梅尔频谱域和对数幅度域的HMM并行训练32-34
2.3.2 基于VTS的含噪语音的HMM参数估计法34-35
2.3.3 在线语音增强过程35
2.4 性能测试35-37
2.4.1 实验数据说明35-36
2.4.2 客观测试方法36-37
2.4.3 主观测试方法37
2.5 测试结果及分析37-45
2.5.1 客观质量测试结果37-41
2.5.2 主观质量测试结果41-43
2.5.3 结果分析43-45
2.6 本章小结45-47
第3章基于能量调整的MFS-HMM语音增强算法47-65
3.1 算法原理47-48
3.2 在线谱能量调整过程48-54
3.2.1 谱能量对MFS域参数统计特性的影响48-49
3.2.2 基于EM算法的谱能量在线调整49-52
3.2.3 基于能量调整的含噪语音的HMM参数估计过程52-53
3.2.4 纯净语音在MFS域的增强算法53-54
3.3 基于能量调整的在线语音增强过程54-55
3.5 性能测试55-62
3.5.1 客观质量测试结果55-60
3.5.2 主观质量测试结果60-62
3.6 本章小结62-65
第4章基于能量调整的MFS-HMM语音增强算法在G.718编码器中的应用65-77
4.1 ITU-T G.718编码器65-68
4.1.2 G.718编码器66-67
4.1.3 G.718解码器67-68
4.2 语音增强算法在G.718中的应用68-69
4.3 算法性能测试69-75
4.3.1 客观质量测试结果69-73
4.3.2 主观质量测试结果73-75
4.4 本章小结75-77
结论77-79
参考文献79-83
攻读硕士学位期间发表的学术论文83-85
攻读硕士学位期间参加的科研项目85-87
致谢87

【参考文献】

中国硕士学位论文全文数据库前1条

1 李瑞;多通道语音增强方法的研究[D];大连理工大学;2008年

，

本文编号：762130

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/762130.html

上一篇：机载MIMO雷达空时自适应处理技术研究进展
下一篇：中波发射台实时监控系统抗干扰技术分析

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|