非平稳噪声环境中的语音增强技术研究
发布时间:2017-06-28 03:13
本文关键词:非平稳噪声环境中的语音增强技术研究,,由笔耕文化传播整理发布。
【摘要】:日常生活中,语音使得人与人之间的交流变得高效。但是,噪声往往会对语音信号造成干扰,降低语音的质量,影响人们之间的交流。通常,噪声具有的不同特性和随机性使得完全消除噪声是不可能的,尤其在非平稳噪声环境中。因此,语音增强的目的是减少语音中含有的噪声,提高语音信号的质量和可懂度。本文从研究传统的语音增强算法入手,分析了一些算法的优缺点。在人耳听觉掩蔽效应的基础上,对一种单通道语音增强算法提出了一些改进。针对语音和噪声同时进入人耳的噪声环境,本文提出了一种基于感知失真测度的语音增强算法,实现了在噪声环境中对语音信号进行增强的目的。本论文主要的工作和创新点如下:1.基于噪声去除的语音增强1)针对增强过程中容易产生语音失真的问题,本文介绍了一种低失真语音估计器。但是,该语音估计器的计算复杂度较高,且在低信噪比情况下,不能准确去噪。针对该问题,本文引入一个过减因子,降低了该语音增强的算法复杂度。改进后,该估计器能够根据信噪比的大小及时调整去噪增益,改进了增强效果。2)为了获得具有较高性能的语音增强系统,需要对噪声谱进行准确地估计。本文引入了一种低延时低复杂度无偏的噪声谱估计方法。该算法能够及时对信号每一帧的噪声谱更新,针对语音信号中含有的非平稳噪声,它能够比较准确地对噪声谱进行估计。通过实验表明,相比传统算法,该算法拥有较好的性能。3)在对语音进行预估计过程中,采用的是基于对数谱最小均方误差的方法,该方法预估出的语音信号更符合人耳听觉特性。通过实验表明,将上述提到的噪声谱估计方法应用到该方法中,预估计的效果要优于传统的方法。2.基于听觉感知的语音增强在语音信号和噪声同时进入人耳的噪声环境中,针对需要对语音信号进行预处理的情况,本文提出了一种基于感知失真测度的增强方法。通过对人耳听觉系统的模拟,将语音信号的能量进行重新分配,使得人耳感知到的语音信号的失真测度最小化。在基于感知失真测度的增强系统中,可以针对不同的应用场景,调节算法的延迟时间,从而能够获得不同的增强效率。通过实验表明,在噪声环境中,该算法能够很好地对语音进行增强。
【关键词】:语音增强 非平稳噪声 噪声谱估计 预处理 听觉掩蔽效应
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.35
【参考文献】
中国期刊全文数据库 前1条
1 陶智,赵鹤鸣,龚呈卉;基于听觉掩蔽效应和Bark子波变换的语音增强[J];声学学报;2005年04期
本文关键词:非平稳噪声环境中的语音增强技术研究,由笔耕文化传播整理发布。
本文编号:492299
本文链接:https://www.wllwen.com/kejilunwen/wltx/492299.html