当前位置:主页 > 科技论文 > 信息工程论文 >

基于单信道的语音增强算法的研究与改进

发布时间:2018-03-30 23:11

  本文选题:语音增强 切入点:谱减法 出处:《广东工业大学》2016年硕士论文


【摘要】:在语音通信中经常受到各种各样噪声的干扰,噪声干扰严重时还可能会使人听觉疲劳或者使语音处理系统性能恶化。为了能够从含有各类噪声的语音信号中尽可能恢复出原始的语音信号,需要使用语音增强技术来抑制或者降低噪声,提高语音信号的质量和可懂度。语音增强按信号获取方式的不同,可以分为单信道、双信道和多信道。目前大多数实际应用的语音信号处理系统多数都还是单信道下工作的,而且由于单信道的语音增强获取得到的信息更少,难度要超过双信道和多信道语音增强。因此,非常有必要对基于单信道的语音增强进行研究和尝试改进。鉴于以上分析,本论文的研究工作主要从如下三个方面进行:1、实际应用环境中噪声利,类多样化,不同的噪声都有着不一样的特性,所以在实际应用中要根据具体的噪声情况选用不同的语音增强算法,才能达到最好的语音增强效果。为此,本文深入阐述了谱减算法、维纳滤波算法和最小均方误差算法的基本原理和实现过程。分别在高斯白噪声、粉红噪声和多说话人babble噪声下进行大量测试。实验结果显示,三种算法在各种噪声环境下均能提高语音的质量,但是不一定都能够提高语音的可懂度。2、对噪声的估计在语音增强技术中至关重要,噪声估计过低时会导致残留较多的背景噪声,而噪声估计过高时会削弱掉微弱的语音信息,不准确的估计最终都会导致语音失真。为此,本文研究了VAD噪声估计算法和基于后验信噪比的时间递归平均的噪声估计算法。由于时间递归平均的算法中存在平滑因子阶跃(0或者1)的现象,本文提出了一种改进措施,改进后保证了平滑因子取值比较合理。最后通过结果显示,改进的算法在低信噪比环境下有比较好的改善效果。3、谱减算法简单高效,实时性很高,适用范围比较广泛,但是谱减算法的缺点是输出均伴有起伏较大且刺耳的音乐噪声。为了解决音乐噪声,人们提出了很多的改进措施。最常用的一种是在减法过程中增加一个或者多个修正系数,以减少音乐噪声的影响,但是修正系数需要根据实验或者经验来确定,适应性比较差。为此,本文研究了基于参数最优控制的谱减算法,并且采用改进的引导判决法来估计先验信噪比,从而确定最优的修正系数。实验结果显示,本文的改进算法对语音的可懂度提高有限,但对语音质量的改善效果明显。
[Abstract]:In speech communication, it is often disturbed by various kinds of noise. Noise interference may also cause hearing fatigue or deterioration of speech processing system performance. In order to be able to recover the original speech signal as much as possible from the speech signal containing all kinds of noise, It is necessary to use speech enhancement technology to suppress or reduce noise and improve the quality and intelligibility of speech signal. At present, most of the speech signal processing systems used in practical applications are still working in single channel, and because of the speech enhancement of single channel, less information can be obtained. It is more difficult than dual-channel and multi-channel speech enhancement. Therefore, it is necessary to study and try to improve the speech enhancement based on single channel. The research work of this paper is mainly carried out in three aspects as follows: 1. In the practical application environment, noise is convenient, various kinds of noise, different noise have different characteristics. Therefore, different speech enhancement algorithms should be selected according to the specific noise in practical application to achieve the best speech enhancement effect. The basic principle and implementation process of Wiener filtering algorithm and minimum mean square error algorithm are tested under Gao Si white noise, pink noise and multi-speaker babble noise respectively. The experimental results show that, The three algorithms can improve the quality of speech in all kinds of noise environments, but not all of them can improve the intelligibility of speech. The estimation of noise is very important in speech enhancement technology. If the noise estimation is too low, it will lead to more background noise, and when the noise estimation is too high, the weak speech information will be weakened, and the inaccurate estimation will eventually lead to speech distortion. In this paper, VAD noise estimation algorithm and time recursive average noise estimation algorithm based on a posteriori signal-to-noise ratio (SNR) are studied. Due to the existence of smoothing factor step 0 or 1) in the time recursive averaging algorithm, an improved method is proposed in this paper. Finally, the result shows that the improved algorithm has better effect of improving in low signal-to-noise ratio environment. The spectral subtraction algorithm is simple and efficient, real-time is very high, and the range of application is wide. However, the disadvantage of spectral subtraction algorithm is that the output is accompanied by large and sharp music noise. In order to solve the music noise, many improvements have been put forward. One of the most commonly used methods is to add one or more correction coefficients in the process of subtraction. In order to reduce the influence of music noise, but the correction coefficient needs to be determined by experiment or experience, the adaptability is poor. Therefore, the spectral subtraction algorithm based on parameter optimal control is studied in this paper. The improved guide decision method is used to estimate the prior signal-to-noise ratio (SNR) and to determine the optimal correction coefficient. The experimental results show that the improved algorithm improves speech intelligibility limited but improves speech quality obviously.
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.35

【相似文献】

相关期刊论文 前10条

1 胡光锐,虞晓;基于二阶前向结构和信息最大理论的语音增强算法[J];上海交通大学学报;2000年07期

2 姚峰英,张敏;用于语音增强的高频信噪比度量[J];声学学报;2002年05期

3 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期

4 王金明,张雄伟;一种基于自适应模糊滤波的语音增强方法[J];解放军理工大学学报(自然科学版);2003年01期

5 杨汇军,郑海英,王立红;语音增强方法的研究[J];辽宁工学院学报;2003年05期

6 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期

7 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期

8 钱国青;赵鹤鸣;;基于改进谱减算法的语音增强新方法[J];计算机工程与应用;2005年35期

9 王晶,傅丰林,张运伟;语音增强算法综述[J];声学与电子工程;2005年01期

10 杨毅;杨宇;余达太;;语音增强及其消噪能力研究[J];微电子学与计算机;2006年07期

相关会议论文 前10条

1 陈凯;俞蒙槐;胡上序;付强;;语音增强系统性能评测方法综述[A];第四届全国人机语音通讯学术会议论文集[C];1996年

2 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

3 徐舒;孙洪;;基于融合迭代的语音增强方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

4 牛刚;任新智;吴国庆;;谐波能量汇集度在语音增强中的应用[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

5 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

6 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

7 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

8 刘淑华;胡强;覃团发;万海斌;;语音增强算法的研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年

9 魏臻;张景达;陆阳;;嵌入式系统中语音增强改进算法的研究[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年

10 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

相关博士学位论文 前10条

1 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年

3 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年

4 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年

5 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

6 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

7 徐勇;基于深层神经网络的语音增强方法研究[D];中国科学技术大学;2015年

8 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年

9 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年

10 赵彦平;基于稀疏表示的语音增强方法研究[D];吉林大学;2014年

相关硕士学位论文 前10条

1 肖佩霖;双通道语音增强系统设计与实现[D];哈尔滨工业大学;2011年

2 魏有权;基于噪声估计的语音增强算法研究[D];昆明理工大学;2015年

3 郭栗;特定人语音增强算法的研究[D];上海交通大学;2015年

4 纪志春;基于字典学习的语音增强算法研究[D];大连海事大学;2016年

5 尹波;基于麦克风小阵列的语音增强算法的研究[D];湖北工业大学;2016年

6 张建伟;基于噪声谱估计和信噪比约束的语音增强研究[D];安徽大学;2016年

7 魏泉水;基于深度神经网络的语音增强算法研究[D];南京大学;2016年

8 王鹏宇;压缩感知技术在语音增强和EEG信号中的应用研究[D];福州大学;2014年

9 魏清泉;有色噪声下语音增强算法及应用研究[D];福州大学;2014年

10 黄剑文;多通道语音增强算法及应用研究[D];福州大学;2014年



本文编号:1688067

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1688067.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4ffab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com