基于噪声估计的语音增强算法研究
本文关键词:基于噪声估计的语音增强算法研究,由笔耕文化传播整理发布。
【摘要】:单通道语音增强在语音信号处理的研究中是一个长期存在的问题。目前,最有效的单通道语音增强方法是基于波形的处理方法,即利用滤波法估计纯净语音信号。在单通道语音增强中我们缺乏背景噪声的知识,因此现有的单通道语音增强方法还不能满足实际应用的要求。主要问题有估计噪声不够准确、增强语音存在失真以及在无语音区缺乏有效的噪声抑制。针对这些问题,本文研究基于噪声估计的语音增强算法。研究目标是降低估计噪声的延时和偏差,减小增强语音的失真,提高语音增强算法在无语音区的抑制噪声能力。本文主要完成了以下几个方面的特色工作:(1)阐述了基于短时谱估计的语音增强和估计噪声算法的基本原理。仿真结果表明谱减法增强后的语音存在大量“音乐噪声”;最小均方误差的短时谱幅度估计方法有效的减少了增强语音中的“音乐噪声”,但增强语音的无语音区残留大量噪声;最小统计的噪声估计方法存在大量延时;基于最小均方误差的噪声估计方法降低了估计噪声的延时,但它的噪声跟踪能力仍有提高的空间。(2)提出了基于最小均方误差(MMSE)和Bayesian风险的噪声估计方法。该方法首先利用MMSE原理推导出噪声估计模型,噪声估计模型包括噪声线性估计量和噪声估计补偿量。噪声线性估计量由维纳滤波法确定,噪声估计补偿量是由偏低补偿量或偏高抵消量确定;然后,我们使用噪声线性估计量所产生的Bayesian风险来判别估计噪声的偏差类型;最后,我们通过语音存在和语音不存在之间误判的条件概率计算偏低补偿量和偏高抵消量。在实验中与典型方法对比,提出的噪声估计方法有效的降低了噪声跟踪延时和对数错误。(3)提出了基于超高斯信号模型和最大后验概率(MAP)的软决策语音增强方法。该方法首先以超高斯语音模型作为实际语音信号的先验分布;利用最大后验概率推导出语音信号连续存在时纯净语音估计。然后我们通过软决策的方法计算出当前含噪语音帧中语音存在的概率。最后,我们利用估计噪声实现语音信号非连续的情况下语音增强的目标。在实验中与典型方法对比,提出的语音增强方法降低了增强语音的失真,并在无语音区对噪声的抑制更加有效。
【关键词】:语音增强 噪声估计 贝叶斯风险 软决策 最小均方误差 最大后验概率
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.35
【目录】:
- 摘要5-7
- ABSTRACT7-12
- 第一章 绪论12-18
- 1.1 研究背景及意义12-13
- 1.2 国内外研究现状及存在的问题13-15
- 1.3 本文研究内容15-16
- 1.4 论文的组织16-18
- 第二章 语音增强的理论基础18-30
- 2.1 信号特性18-19
- 2.1.1 语音特性18
- 2.1.2 噪声特性18-19
- 2.2 信号模型19-23
- 2.2.1 语音和噪声信号的先验分布20-21
- 2.2.2 似然函数21-22
- 2.2.3 含噪语音信号分布22
- 2.2.4 语音信号的瑞利分布22-23
- 2.3 语音质量评价方法23-27
- 2.3.1 主观评价24-25
- 2.3.2 客观评价25-27
- 2.4 小结27-30
- 第三章 基于短时域的语音增强和噪声估计算法30-42
- 3.1 谱减法30-33
- 3.1.1 谱减法的原理30-31
- 3.1.2 谱减法的缺点31-33
- 3.2 维纳滤波法33-34
- 3.3 最小均方误差的短时谱幅度估计34-37
- 3.4 最小统计的噪声估计37-38
- 3.5 最小均方误差的噪声估计38-40
- 3.6 小结40-42
- 第四章 基于MMSE和BAYESIAN风险的噪声估计42-58
- 4.1 噪声估计方法依据43-44
- 4.1.1 统计模型43
- 4.1.2 基于MMSE的噪声估计43-44
- 4.2 基于MMSE和BAYESIAN风险的噪声估计44-49
- 4.2.1 建立噪声估计模型44-46
- 4.2.2 确定事件判别错误产生的风险46-47
- 4.2.3 发生检测结果误判的概率47-49
- 4.3 实验结果49-55
- 4.3.1 跟踪延时49-51
- 4.3.2 降噪性能51-55
- 4.4 小结55-58
- 第五章 基于超高斯信号模型和MAP的软决策语音增强58-76
- 5.1 信号的超高斯先验分布58-59
- 5.2 MAP的语音谱幅度估计59-61
- 5.3 两种软决策状态61-62
- 5.4 软决策状态的MAP语音幅度估计62-64
- 5.5 实验结果64-74
- 5.5.1 语音质量感知评价65-68
- 5.5.2 语谱图68-73
- 5.5.3 运行速度73-74
- 5.6 小结74-76
- 第六章 总结和展望76-78
- 6.1 论文总结76-77
- 6.2 下一步工作77-78
- 致谢78-80
- 参考文献80-86
- 附录A 攻读硕士期间参与项目86-87
- 附录B 攻读硕士期间申请软件著作权87
【共引文献】
中国期刊全文数据库 前10条
1 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
2 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
3 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
4 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
5 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
6 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
7 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
8 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
9 刘惠华,潘建军,周冰,范京;稀疏谱线合成对元音频域信息分布的探讨[J];北京机械工业学院学报;2005年01期
10 何强,毛士艺,张有为;汉语语音识别的平滑声韵基元HMM算法[J];北京航空航天大学学报;2001年02期
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
3 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
4 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
5 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
6 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
7 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
8 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
9 魏宇;基于小波变换的舰船航行数据记录仪数字水印算法的研究[D];哈尔滨工程大学;2011年
10 韩志艳;语音信号鲁棒特征提取及可视化技术研究[D];东北大学;2009年
本文关键词:基于噪声估计的语音增强算法研究,由笔耕文化传播整理发布。
,本文编号:342747
本文链接:https://www.wllwen.com/kejilunwen/wltx/342747.html