基于形态成分分析的语音活动检测
发布时间:2017-12-02 18:29
本文关键词:基于形态成分分析的语音活动检测
【摘要】:语音活动检测(Voice Activity Detection,VAD)以判别语音信号中语音段和非语音段为目的,在语音编码、语音合成、语音分析、语音增强、说话人识别等应用中起着基础性的作用,是其他应用的前导步骤。其重要作用表现在两个方面。一方面非语音是语音处理中的无用数据,排除非语音有利于减少无用数据的处理量,提高系统效率。另一方面,非语音中通常含有噪声信号,将严重降低系统性能。因此,语音活动检测的研究有着重要意义。目前,语音活动检测方法主要有基于特征参数、基于统计模型和基于机器学习的方法。在有变化的噪声的情况下,检测方法的结果会受到影响,准确率不是很高。因此,本文针对这一问题,把形态成分分析方法应用于语音活动检测,提出了基于形态成分分析的方法,以提高语音活动检测的鲁棒性和准确性,其主要工作如下:本文具体提出了两种基于形态成分分析的语音活动检测方法,分别是变化的噪声下的语音活动检测方法、在线更新噪声字典的语音活动检测方法,还把一种字典优化用于提出的语音活动检测方法。一、变化的噪声下的语音活动检测方法,主要步骤有特征提取,把信号做分帧、加窗处理,然后再进行傅里叶变换,以幅度谱作为特征;使用K-SVD算法训练语音和噪声字典;使用GMM识别噪声类型,为每一种噪声类型训练一个GMM模型,然后训练好的GMM计算识别陌生噪声类型,选择噪声字典;使用MCA算法稀疏编码并且判定结果,把选择的噪声字典和语音字典拼接成大字典,用于MCA算法,通过得到的稀疏系数,判定检测结果。这种方法能适应不同噪声环境,实验表明该方法有比较高的检测准确率。二、在线更新噪声字典的语音活动检测方法,主要步骤有特征提取,分帧、加窗预处理后,进行傅里叶变换得到幅度谱特征;字典学习,用K-SVD算法训练语音字典;噪声字典在线更新,利用在线字典更新算法训练噪声字典;字典拼接和用MCA稀疏编码,拼接语音字典和噪声字典,用于MCA算法;对每一帧信号进行分类,通过稀疏系数区分语音帧和非语音帧。这种方法可以直接利用信号中的噪声训练噪声字典,不需要特定的噪声训练数据,能使噪声字典更好的适应信号,实验表明该方法具有比较高的检测准确率。三、字典优化的方法,首先为了去除不重要的原子,提出了标记重要原子的算法,这样就可以区分原子是否重要。然后为了去除有害原子,提出了去除有害原子算法,这样就达到了字典优化的目的。通过字典优化能够提高字典质量,进而提高了利用字典方法的检测准确率,实验表明字典优化后语音活动检测的检测准确率的确所有提高。本文对以上几种方法都进行了实验,得到了实验结果的图表和数据,并且进行了说明分析。经过对比实验结果得出,本文所提出的方法具有更好的抗噪性能,具有更高的检测准确性,证明了本文算法的有效性。
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【参考文献】
中国期刊全文数据库 前3条
1 何勇军;付茂国;孙广路;;语音特征增强方法综述[J];哈尔滨理工大学学报;2014年02期
2 何勇军;孙广路;付茂国;韩纪庆;;基于稀疏编码的鲁棒说话人识别[J];数据采集与处理;2014年02期
3 韩卫丽;邹建成;李建伟;;一种基于信号稀疏表示的语音去噪新方法[J];北方工业大学学报;2013年03期
中国硕士学位论文全文数据库 前1条
1 杨春旺;基于多观测似然比的语音活动检测研究与系统实现[D];哈尔滨工业大学;2013年
,本文编号:1245897
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1245897.html