当前位置:主页 > 科技论文 > 自动化论文 >

改进的参数自适应的维纳滤波语音增强算法

发布时间:2018-04-22 02:05

  本文选题:语音增强 + 参数自适应 ; 参考:《太原理工大学》2017年硕士论文


【摘要】:近年来,随着信息技术的发展,助听器的技术已日渐成熟,使用智能手机进行语音通信已经成为了人们生活中的必需品,人机交互也逐渐进入了人们的视野,语音已经成为了日常生活中不可或缺的一部分,所以,对语音进行处理成为了迫在眉睫的事情。然而现实生活中,在进行语音处理时,噪声却无处不在,纷繁复杂的噪声成为了处理语音过程中最大的障碍。过去几十年,如何将纯净语音从含噪语音中分离出来一直是各个研究者研究的重点,直至今日,语音增强依然是一个十分活跃的领域。传统的语音增强算法包括谱减法,维纳滤波算法,子空间法,最小均方误差法等。当进行语音增强时,这些传统的算法都没有考虑到不同的噪声对语音信号产生的不同影响。实际上,语音增强过程中包括语音估计和噪声估计两个重要的阶段,在进行噪声估计时,不同的噪声频谱特征不尽相同。本文在此理论基础上提出了根据不同噪声进行参数自适应的语音增强算法。首先,介绍了语音和噪声的相关理论,包括语音和噪声的主要特征,含噪语音的信号模型及噪声评估算法。对近年来的语音增强算法进行归纳总结与比较分析,并对经典的语言增强算法进行仿真实验,分析得出经典算法普遍存在的问题——同一种语音增强算法不能对所有的噪声类型都起到作用。其次,若要使得语音增强算法针对不同的噪声做出不同的处理,就要对噪声进行准确的分类。为了能够对噪声进行准确的分类,本文在对经典的分类算法进行了归纳总结后,阐述了这些分类算法在大数据的处理方面存在的问题,进而提出了本文所使用的分类算法——基于深度置信网络的噪声分类算法(Deep belief networks),并对此算法的分类过程进行了详细的介绍,对其分类的准确性进行了仿真实验并将其与人工神经网络算法的分类准确性进行了对比,结果表明:本文提出的分类算法具有较高的分类准确性。第三,由于基于先验信噪比的维纳滤波语音增强算法能够较大程度的提高语言的质量并且含有较少的音乐噪声,所以本文对基于先验信噪比的维纳滤波语音增强算法进行了详细的推导与分析,并对其进行了相应的仿真实验,得出此算法不能提高所有噪声类型干扰下的语音质量,即而提出了本文的算法——基于噪声分类的参数自适应维纳滤波语音增强算法。本文选用了声音活动检测(VAD)法对噪声功率谱进行估计,并将其与维纳滤波算法结合得到不同噪声条件下的最优的参数组合。将此最优参数组合应用到之前使用深度置信网络算法进行分类后得到的噪声种类中去,并对先验信噪比的高估部分进行修正,最终得到本文提出的语音增强算法。最后,对提出的算法进行实验仿真,将其与经典的基于先验信噪比的维纳滤波算法进行比较,评估算法包括质量评估和可懂度评估,质量评估选用语音质量感知评估(PESQ),可懂度评估选用标准化协方差法(NCM)。在实验的最后对未知的噪声也进行了仿真实验分析,将未知噪声使用本文提出的分类算法匹配到已知噪声中,根据匹配的类型选用最优的参数组合进行语音增强,来证明本文提出的算法具有普遍适用性。结果表明,本文提出的算法能在不降低低信噪比语音可懂度的同时提高语音的质量,并且对未知噪声具有普遍适用性。
[Abstract]:In recent years, with the development of information technology, the technology of hearing aids has matured. The use of smart phone for voice communication has become a necessity in people's life. Human-computer interaction has gradually entered people's field of vision. Voice has become an indispensable part of daily life. Therefore, the processing of voice has become a pressing problem. In the real life, however, in the real life, noise is ubiquitous in the process of speech processing, and the complex noise has become the biggest obstacle in the process of speech processing. In the past few decades, how to separate the pure voice from the noisy speech has been the focus of the researchers. Until today, the speech enhancement is still a one. The traditional speech enhancement algorithms include spectral subtraction, Wiener filtering, subspace, minimum mean square error, etc. when speech enhancement, these traditional algorithms do not take into account the different effects of different noise on speech signals. In fact, speech enhancement includes speech estimation and noise. Two important stages are estimated. In the process of noise estimation, different noise spectrum features are different. Based on this theory, a speech enhancement algorithm based on the adaptive parameters of different noises is proposed. First, the correlation theory of speech and noise, including the main features of sound and noise, and the signal mode of noisy speech, is introduced. Type and noise evaluation algorithms. The speech enhancement algorithms in recent years are summarized and compared, and the classical language enhancement algorithms are simulated and analyzed. The common problems of the classical algorithms are analyzed. The same speech enhancement algorithm can not play a role in all noise types. Secondly, if the speech enhancement is made, the speech enhancement is made. In order to classify the noise accurately in order to make different noises for different noises. In order to classify the noise accurately, after summarizing the classical classification algorithms, this paper expounds the problems existing in the processing of large data by these classification algorithms, and then puts forward the classification calculation used in this paper. Method - Deep belief networks based on deep confidence network, and the classification process of the algorithm is introduced in detail, and the accuracy of the classification is simulated and compared with the classification accuracy of artificial neural network algorithm. The results show that the classification algorithm proposed in this paper is higher. Third, because the Wiener filtering speech enhancement algorithm based on the prior signal-to-noise ratio can greatly improve the quality of the language and contains less music noise, this paper makes a detailed deduction and analysis of the Wiener filtering speech enhancement algorithm based on the prior signal-to-noise ratio, and carries out the corresponding simulation. It is concluded that this algorithm can not improve the speech quality under all noise types. That is, the algorithm, the adaptive Wiener filtering speech enhancement algorithm based on the noise classification, is proposed. The sound activity detection (VAD) method is used to estimate the noise power spectrum, and it is combined with the Wiener filtering algorithm. The optimal combination of parameters under the same noise condition is used to apply the optimal parameter combination to the kind of noise classification obtained before using the depth confidence network algorithm, and to modify the overestimation part of the prior signal to noise ratio. Finally, the speech enhancement algorithm proposed in this paper is obtained. Finally, the proposed algorithm is simulated by experiments. Compared with the classical Wiener filtering algorithm based on the prior signal to noise ratio, the evaluation algorithm includes the quality evaluation and the intelligibility evaluation, the quality evaluation selects the speech quality perception assessment (PESQ), the intelligibility evaluation selects the standardized covariance method (NCM). The simulation experiments are carried out at the end of the experiment. The unknown noise is also analyzed. It is proved that the algorithm proposed in this paper is universally applicable. The results show that the algorithm proposed in this paper can improve the quality of speech at the same time without reducing the speech intelligibility of low signal to noise ratio and to the unknown. Noise is universally applicable.

【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.35

【相似文献】

相关期刊论文 前10条

1 李倩,王让定,陈金儿;基于改进阈值的小波域语音增强算法[J];宁波大学学报(理工版);2005年03期

2 胡光锐,虞晓;基于二阶前向结构和信息最大理论的语音增强算法[J];上海交通大学学报;2000年07期

3 姚峰英,张敏;用于语音增强的高频信噪比度量[J];声学学报;2002年05期

4 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期

5 王金明,张雄伟;一种基于自适应模糊滤波的语音增强方法[J];解放军理工大学学报(自然科学版);2003年01期

6 杨汇军,郑海英,王立红;语音增强方法的研究[J];辽宁工学院学报;2003年05期

7 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期

8 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期

9 钱国青;赵鹤鸣;;基于改进谱减算法的语音增强新方法[J];计算机工程与应用;2005年35期

10 王晶,傅丰林,张运伟;语音增强算法综述[J];声学与电子工程;2005年01期

相关会议论文 前10条

1 陈凯;俞蒙槐;胡上序;付强;;语音增强系统性能评测方法综述[A];第四届全国人机语音通讯学术会议论文集[C];1996年

2 王建波;林本浩;田春明;刘睿;;语音增强及其相关技术研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

3 徐舒;孙洪;;基于融合迭代的语音增强方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

4 牛刚;任新智;吴国庆;;谐波能量汇集度在语音增强中的应用[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

5 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

6 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

7 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

8 刘淑华;胡强;覃团发;万海斌;;语音增强算法的研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年

9 魏臻;张景达;陆阳;;嵌入式系统中语音增强改进算法的研究[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年

10 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

相关博士学位论文 前10条

1 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年

2 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

3 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年

4 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年

5 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年

6 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

7 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

8 徐勇;基于深层神经网络的语音增强方法研究[D];中国科学技术大学;2015年

9 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年

10 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年

相关硕士学位论文 前10条

1 肖佩霖;双通道语音增强系统设计与实现[D];哈尔滨工业大学;2011年

2 陈成斌;针对于家居环境的语音增强系统的研究与开发[D];华南理工大学;2015年

3 魏有权;基于噪声估计的语音增强算法研究[D];昆明理工大学;2015年

4 胡勇;麦克风阵列语音增强算法研究[D];电子科技大学;2014年

5 曹后斌;有色背景噪声环境下语音增强系统的设计与实现[D];电子科技大学;2014年

6 马小惠;阵列语音增强在车载环境中的应用[D];大连理工大学;2015年

7 李达;无线声学传感器网络中分布式语音增强方法研究[D];大连理工大学;2015年

8 高珍珍;基于梅尔频谱域HMM的语音增强方法研究[D];北京工业大学;2015年

9 宋环宇;全数字助听器语音增强算法研究[D];哈尔滨工业大学;2014年

10 王永杰;基于麦克风阵列的语音增强算法研究[D];西安电子科技大学;2014年



本文编号:1785102

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1785102.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户90557***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com