噪声环境下的语音激活检测算法研究
发布时间:2017-03-19 03:08
本文关键词:噪声环境下的语音激活检测算法研究,,由笔耕文化传播整理发布。
【摘要】:变速率语音编码技术在陆地蜂窝移动通信、卫星移动通信、VoIP等数字通信系统中有着广泛的应用前景,而语音激活检测(Voice Activity Detection,VAD)算法是实现变速率语音编码的关键技术之一。采用VAD算法实现的变速率声码器能在合成语音质量和带宽资源之间取得灵活的折衷,因此,研究出稳健、可靠的VAD算法,尤其是在噪声环境下,对变速率语音编码技术的发展具有重要的意义。目前,语音激活检测方面已有不少的研究成果,其中,基于隐马尔科夫模型(Hidden Markov Model,HMM)的VAD算法能够较好地区分话音信号和背景噪声信号,是目前数字语音信号处理重点研究课题。本文从课题的研究背景与现状入手,简要阐述了VAD算法的基本原理和噪声特性,介绍了自适应多速率编码(Adaptive Multi-Rate,AMR)标准中和G.729B编码标准中的VAD算法的实现过程,并分析其优缺点。然后重点研究了基于HMM模型的VAD算法并进行改进。最后将其应用到了低速率声码器中,实现了一种可变速率的声码器。具体工作如下:1.为了改善现有基于HMM模型VAD算法对噪声的跟踪性能,本文采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应的噪声模型,建立了噪声模型库。在检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型。同时,本文对阈值计算方法进行改进,提高算法判决准确率。实验结果表明,本文算法具有较高的检测准确率及较好的噪声跟踪能力。2.将改进后的VAD算法通过非连续传输技术应用到4kb/s混合激励线性预测(Mixed Excitation Linear Prediction,MELP)声码器中。编码器端对VAD判决出的话音帧采用全速率编码,而对判决出的背景噪声帧采用较低速率编码或者不编码,从而实现了一种可变速率声码器。性能测试结果表明,本文实现的可变速率声码器在保证合成语音语音质量情况下,平均编码速率大幅度降低,说明了本文VAD算法在实时语音中具有良好的实用性。
【关键词】:变速率语音编码 MELP VAD HMM
【学位授予单位】:重庆邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【目录】:
- 摘要3-4
- Abstract4-11
- 注释表11-12
- 第1章 绪论12-19
- 1.1 论文的研究背景及意义12-13
- 1.2 国内外研究现状13-15
- 1.3 评价指标15-17
- 1.3.1 VAD算法的评价指标15-16
- 1.3.2 变速率声码器性能评价指标16-17
- 1.4 论文的组织结构17-19
- 第2章 语音激活检测算法分析19-33
- 2.1 语音激活检测算法的基本原理19-25
- 2.1.1 预处理模块19-20
- 2.1.2 特征参数提取20-24
- 2.1.3 判决方法24
- 2.1.4 VAD输出24-25
- 2.2 噪声特性及分类25-28
- 2.2.1 噪声特性25-26
- 2.2.2 噪声分类26-28
- 2.3 语音编码标准中的VAD算法28-32
- 2.3.1 AMR中的VAD算法28-30
- 2.3.2 G.729B中的VAD算法30-32
- 2.4 本章小结32-33
- 第3章 基于HMM模型的语音激活检测算法33-54
- 3.1 HMM模型的基本原理33-40
- 3.1.1 HMM模型的定义33-34
- 3.1.2 HMM模型的三个基本问题34-39
- 3.1.3 连续的HMM模型39-40
- 3.2 基于HMM模型的VAD算法基本原理40-42
- 3.2.1 训练模块40-41
- 3.2.2 检测模块41-42
- 3.3 改进的基于HMM模型的VAD算法42-46
- 3.4 实验结果及分析46-52
- 3.5 本章小结52-54
- 第4章 基于HMM模型的VAD算法在语音编码中的应用54-70
- 4.1 4kb/s MELP声码器的实现54-57
- 4.1.1 MELP编码器原理54-55
- 4.1.2 MELP解码器原理55-56
- 4.1.3 4kb/s MELP声码器的实现56-57
- 4.2 变速率声码器的实现57-61
- 4.2.1 DTX技术57-59
- 4.2.2 舒适噪声生成59
- 4.2.3 编解码器的实现59-61
- 4.3 性能测试及分析61-68
- 4.3.1 仿真结果61-64
- 4.3.2 PESQ值测试64-66
- 4.3.3 平均编码速率估算66-68
- 4.4 本章小结68-70
- 第5章 总结与展望70-72
- 5.1 论文总结70-71
- 5.2 后续工作研究71-72
- 参考文献72-76
- 致谢76-77
- 攻读硕士学位期间从事的科研工作及取得的成果77
【参考文献】
中国期刊全文数据库 前3条
1 张金榜;尹冬梅;;基于统计模型的语音激活检测算法改进[J];微型机与应用;2015年12期
2 肖佳林;赵聿晴;王英;;基于HMM与SVM的语音活动检测[J];计算机工程;2014年01期
3 王民;任雪妮;孙洁;;一种高效的基音检测与评估算法[J];计算机工程与应用;2014年14期
本文关键词:噪声环境下的语音激活检测算法研究,由笔耕文化传播整理发布。
本文编号:255435
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/255435.html