噪声环境下的VAD检测方法的研究
本文关键词: 语音端点检测 信噪比 倒谱距离 降噪自编码器 出处:《新疆大学》2017年硕士论文 论文类型:学位论文
【摘要】:语音端点检测(Voice Activity Detection,VAD)主要指的是检测一段语音信号的起始点和终止点,以便于分离有效的语音信号和无用的语音信号或者噪音信号,使得后续的处理更加有效率。它应用非常广泛,常用于语音识别系统、语音增强、语音编码等任务上。当前端点检测的研究主要有两个方向,其一就是通过阈值来进行检测,常用的方法有基于短时能量过零率的检测、基于信息熵的检测等。而另一种检测方法是基于模式识别的检测,常用的方法有常见的有基于隐马尔科夫模型(Hidden Markov Model,HMM)的检测、基于支持向量机的检测等。语音端点检测的检测结果好坏对后续的语音处理起着决定性的作用。本文的研究主要是基于噪声环境下的端点检测方法的研究,由于在低信噪比下的传统的检测方法都存在检测率不高的问题,因此本文首先对语音进行预处理,实现语音的有效去噪,然后通过传统的基于倒谱距离的检测方法来进行检测,在降噪的过程中,本文应用了最近几年的研究热点深度学习的知识,提出了将深度学习下的降噪自编码器用于语音去噪,并取得了一定的效果。由于噪声与语音信号之间的复杂关系,并且在我们的生活中,声音常常受到的是加性噪声的影响,因此本文重点研究了语音信号在不同噪声不同信噪比下的检测性能,实验选取了NOISE92噪声库中Factory、volvo以及white三种噪声以及纯净语音库TIMIT中部分语音数据,同时合成不同噪声类型下不同信噪比的带噪语音,在实验中,合成了包含信噪比为-10d B到10d B之间的五种带噪数据,然后通过梯度下降法(gradient descent)来训练降噪自编码器(Denoising Autoencoder,DAE),来实现对加噪之后的语音信号的重构,使其与原始纯净语音信号的误差最小,从而实现降噪的目的,进而通过倒谱距离的检测方法来实现语音端点的检测,从而提高低信噪比下端点检测的正确率。实验结果表明,特别是在低信噪比条件下传统的端点检测方法正确率都是急剧下降,但是将本文提出的方法用于语音端点检测时,其语音信号的检测正确率明显得到提升,尤其是在0dB以下的低信噪比情况下,相比传统的检测算法,其检测正确率更高。
[Abstract]:Voice Activity Detection (VAD) mainly refers to the starting point and the terminating point of detecting a segment of speech signal. In order to separate the effective speech signal from the useless speech signal or noise signal, it makes the subsequent processing more efficient. It is widely used in speech recognition system and speech enhancement. In speech coding and other tasks, the current research on endpoint detection has two main directions, one is to detect by threshold, and the commonly used methods are based on short-time energy zero-crossing rate detection. Another detection method is based on pattern recognition, and the common methods are Hidden Markov Model based on Hidden Markov Model. HMM-). The detection results of speech endpoint detection play a decisive role in the subsequent speech processing based on support vector machine. The research of this paper is mainly based on the noise environment of endpoint detection methods. Because the detection rate is not high in the traditional detection methods under low SNR, the speech is preprocessed in this paper to achieve effective speech denoising. Then the traditional detection method based on cepstrum distance is used to detect. In the process of noise reduction, this paper applies the knowledge of hot spot depth learning in recent years. In this paper, the denoising self-encoder based on deep learning is applied to speech denoising, and some results are obtained. Because of the complex relationship between noise and speech signal, and in our daily life. The sound is often affected by additive noise, so this paper focuses on the detection performance of speech signals under different noise and different SNR. The Factory in the NOISE92 noise database is selected in the experiment. Three kinds of noises, volvo and white, as well as some speech data in pure speech corpus TIMIT, are synthesized with different signal-to-noise ratio (SNR) under different noise types. Five kinds of noisy data are synthesized with signal-to-noise ratio (SNR) of -10dB to 10dB. Then the noise reduction self-encoder is trained by gradient descent method (Denoising Autocoderdai). To realize the reconstruction of the speech signal after adding noise, so that the error between the speech signal and the original pure speech signal is minimized, so as to achieve the purpose of noise reduction, and then to realize the detection of speech endpoints through the detection method of cepstrum distance. The experimental results show that the accuracy of the traditional endpoint detection methods is decreased sharply, especially in the low SNR condition. However, when the proposed method is used in speech endpoint detection, the detection accuracy of speech signal is obviously improved, especially in the case of low SNR below 0 dB, compared with the traditional detection algorithm. The correct rate of detection is higher.
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 赵果;潘世永;;端点检测在嵌入式声控拨号器中的应用[J];兵工自动化;2007年02期
2 王亚涛,朴春俊,权花紫;强噪音情况下的多种端点检测方法研究[J];信息技术;2005年02期
3 邝航宇,张军,韦岗;一种基于检测元音的孤立词端点检测算法[J];电声技术;2005年03期
4 方杰;李英;钱红;;一种连续词端点检测的改进方法[J];电声技术;2006年08期
5 李晋;王玲;;一种改进的孤立词端点检测方法[J];计算机工程与应用;2006年30期
6 何清波;孔凡让;王建平;刘永斌;;基于独立分量分析特征提取的带噪信号端点检测[J];数据采集与处理;2007年01期
7 董胡;钱盛友;;一种基于小波和时频分解的端点检测方法[J];微计算机信息;2007年30期
8 李亦佳;赵淳;;嵌入式平台的复杂环境下端点检测[J];电脑编程技巧与维护;2008年17期
9 周娜;赵振东;张莹;;背景噪声下的端点检测算法的研究[J];通信技术;2008年07期
10 张亚歌;张太镒;夏川;;噪声评估在端点检测中的应用[J];计算机技术与发展;2010年09期
相关会议论文 前8条
1 贾川;张健;陈振标;徐波;;噪声环境下的端点检测算法研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 王卓;李鹏;苏牧;徐波;;噪音环境下基于高阶谱的端点检测算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 王月;屈百达;李金宝;蒋纯刚;;一种改进的基于频带方差的端点检测算法[A];2007中国控制与决策学术年会论文集[C];2007年
4 尹巧萍;吴海宁;赵力;;含噪语音信号端点检测方法的研究[A];2008’促进中西部发展声学学术交流会论文集[C];2008年
5 尹洪兵;秦斌;张凡;黄云森;;一种基于能量-过零率比的端点检测方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
6 国雁萌;潘接林;颜永红;韩疆;张建平;;基于子带能量的自适应端点检测[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 朱杰;韦晓东;;采用HMM模型方法进行语音信号的端点检测[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
相关重要报纸文章 前1条
1 中国科学院声学研究所研究员 俞铁城;语音的端点检测和系统的打断功能[N];通信产业报;2005年
相关博士学位论文 前1条
1 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年
相关硕士学位论文 前10条
1 杨喜敬;带噪汉、彝语孤立词的端点检测方法对比研究[D];昆明理工大学;2015年
2 邢立钊;语音信号端点检测算法的研究[D];郑州大学;2016年
3 沈蓉;智能门禁系统声纹识别中端点检测算法研究[D];西安科技大学;2015年
4 吴品奇;音符识别算法研究[D];湖北工业大学;2016年
5 张诗s,
本文编号:1465413
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1465413.html