当前位置:主页 > 科技论文 > 信息工程论文 >

基于语音存在不确定度的码书驱动语音增强方法研究

发布时间:2017-06-12 11:00

  本文关键词:基于语音存在不确定度的码书驱动语音增强方法研究,由笔耕文化传播整理发布。


【摘要】:经过40多年的发展,研究者们提出了许多语音增强算法,如谱减算法、维纳滤波算法和基于统计模型的算法。这些算法在平稳噪声环境下能取得较好的增强效果,而在处理非平稳噪声时,其算法性能下降严重。码书驱动算法克服了上述算法的局限性,即使在非平稳噪声环境下仍然能获得较好的增强效果。码书驱动算法将语音和噪声的自回归(Auto-Regressive,AR)系数作为先验信息进行线下训练存储在码书中,并在线上通过对数谱失真准则估计各自对应的AR增益,所获得的AR参数用于构建维纳滤波器,从而增强带噪语音信号。但是码书驱动算法仍然存在三方面不足:一是码书驱动算法的AR参数估计不准确,导致在静音段仍然残留大量背景噪声;二是该算法只考虑提高语音的幅度谱估计性能,却忽略了语音的相位谱估计;三是传统先验码书只对语音和噪声的谱包络建模,而没有对其谱细节进行建模,这造成增强语音的谐波间仍然残留大量的背景噪声。针对上述三点不足,本文提出了如下改进方法:1.针对码书驱动算法的AR参数估计不准确问题,本文提出了一种基于语音存在不确定度的码书驱动语音增强算法。该算法在原始Bayesian参数估计框架中考虑了两种假设,即语音存在假设和语音不存在假设。与传统方法不同,语音和噪声的AR参数的Bayesian估计是在两个假设条件下得到的AR参数估计的加权和,其中的加权系数是线上基于帧变化的语音存在概率(speech presence probability,SPP)和语音不存在概率(speech absence probability,SAP)。增强语音谱仍然由重构的维纳滤波器得到。由于所提算法在Bayesian框架中结合了SPP和SAP,因此能够提高AR参数的估计精度。2.针对传统码书驱动算法忽略语音相位谱估计的问题,本文提出了一种纯净语音相位谱估计算法。该算法利用纯净语音、噪声和含噪语音之间的向量关系得到含噪语音与纯净语音相位差的余弦表达式,进而利用反余弦函数和含噪语音的相位得到纯净语音的相位估计。所估计的语音相位谱取代传统含噪语音相位谱与增强语音幅度谱相结合来得到纯净语音信号,进一步提高了低信噪比下的增强语音的感知质量。3.在前述的基于语音存在不确定度的码书驱动算法中,SPP和SAP存在估计精度不高以及无法抑制增强语音谐波间噪声的问题,为此,本文提出了一种基于贝叶斯AR参数估计的码书驱动语音增强算法。为了提高SPP和SAP的估计精度,该算法结合当前帧和过去帧的含噪语音信号来估计语音和噪声的AR参数。同时,利用隐马尔可夫模型(Hidden Markov Model,HMM)理论来推导SPP和SAP,并利用归一化互相关系数对HMM中语音存在状态和语音不存在状态之间的转移概率进行调整,此外,该算法将基于频点的语音存在概率与维纳滤波器相结合,有效抑制了增强语音谐波间的噪声。实验证明,所提算法要优于参考算法。
【关键词】:语音增强 码书驱动 语音存在不确定度 自回归系数 隐马尔可夫模型
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.35
【目录】:
  • 摘要5-7
  • Abstract7-11
  • 第1章 绪论11-21
  • 1.1 课题背景11-12
  • 1.2 国内外研究现状12-18
  • 1.2.1 基于幅度谱估计的语音增强方法12-17
  • 1.2.2 基于相位谱估计的语音增强方法17-18
  • 1.3 研究目的18
  • 1.4 研究内容18-19
  • 1.5 论文结构19-21
  • 第2章 基于码书驱动的语音增强算法21-39
  • 2.1 用于码书驱动语音增强的特征参数21-27
  • 2.1.1 倒谱特征参数估计21-23
  • 2.1.2 AR特征参数估计23-27
  • 2.2 基于ML的码书驱动算法27-32
  • 2.2.1 原理框图28
  • 2.2.2 算法原理28-32
  • 2.3 基于Bayesian的码书驱动算法32-35
  • 2.3.1 原理框图32-33
  • 2.3.2 算法原理33-35
  • 2.4 特征参数与语音增强效果的关系35-38
  • 2.5 本章小结38-39
  • 第3章 基于语音存在不确定度的码书驱动语音增强算法39-59
  • 3.1 算法框图39-41
  • 3.2 基于语音存在不确定度的Bayesian参数估计41-45
  • 3.3 MCRA噪声估计算法45-47
  • 3.4 纯净语音相位估计算法47-49
  • 3.5 算法性能测试49-58
  • 3.5.1 三种客观测试方法介绍49-50
  • 3.5.2 测试结果及分析50-58
  • 3.6 本章小结58-59
  • 第4章 基于贝叶斯AR参数估计的码书驱动语音增强算法59-79
  • 4.1 隐马尔可夫模型59-62
  • 4.1.1 Markov链59-60
  • 4.1.2 HMM的基本元素60-61
  • 4.1.3 HMM的基本算法61-62
  • 4.2 算法框图62-63
  • 4.3 AR参数的Bayesian估计63-67
  • 4.4 修正的维纳滤波器67-70
  • 4.4.1 基于固定先验似然比的改进后验语音存在概率估计67-69
  • 4.4.2 修正维纳滤波器69-70
  • 4.5 算法性能测试70-78
  • 4.5.1 测试项及参考算法70-71
  • 4.5.2 测试结果及分析71-78
  • 4.6 本章小结78-79
  • 结论79-81
  • 参考文献81-87
  • 攻读硕士学位期间所发表的学术论文87-89
  • 攻读硕士学位期间参加的科研项目89-91
  • 致谢91

  本文关键词:基于语音存在不确定度的码书驱动语音增强方法研究,由笔耕文化传播整理发布。



本文编号:443849

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/443849.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4723c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com