基于能量检测的复杂环境声音识别
本文关键词:基于能量检测的复杂环境声音识别 出处:《福州大学》2014年硕士论文 论文类型:学位论文
更多相关文章: 自适应能量检测 非平稳噪声功率谱估计 Mel尺度的小波包分解子带倒谱系数 高斯混合模型 支持向量机 双层分类模型
【摘要】:随着现代社会经济的不断发展,生态环境越来越受到关注,而包含丰富信息的环境声音又是生态环境中不可或缺的元素之一,因此对生态环境中各种不同的声音进行分析和识别,对生态环境的保护和可持续发展具有潜在的重大意义。现实生态环境中噪声无处不在也不可避免,本文将复杂背景噪声环境下的鸟类声音识别作为研究的切入点,提出了经过自适应能量检测(AED)后基于Mel尺度的小波包分解子带倒谱系数(MWSCC)特征结合高斯混合模型(GMM)与支持向量机(SVM)双层混合分类模型的环境声音识别方法,并将该方法推广到更一般化的复杂背景噪声下的环境声音识别。本文主要的研究工作包括如下三个方面:1)自适应能量检测:针对信号检测中常用的能量检测方法需要预先知道噪声方差以及固定检测阈值设定困难这两个问题,提出自适应能量检测方法。根据频率分布特点,先将带噪声音信号划分成子频带,对每个频带的声音信号进行非平稳噪声功率谱估计;再利用噪声估计中的前景声音存在概率设定能量检测概率,进而推导出具有针对性的能量检测阈值;最后根据估计的噪声方差与自适应的检测阈值,构成能量检测的自适应判决规则,对有用声音进行检测。2)改进的特征提取:针对Mel频率倒谱系数(MFCC)特征在复杂噪声环境下识别性能差的缺点以及环境声音具有多变性、多样性、非平稳性、非结构化等特点,提出基于Mel尺度的小波包分解子带倒谱系数(MWSCC)特征。并将前端的自适应能量检测(AED)与MWSCC特征提取相结合,得到AED_MWSCC,只对检测到有用声音信号的声音帧提取MWSCC抗噪特征,在优化声音分类识别性能的同时也降低了时间复杂度。3)双层混合分类模型:利用GMM适合于处理连续声音信号,SVM适合于进行声音分类的特点,提出GMM和SVM混合的双层分类模型,用第一层的GMM描述环境声音的特征分布进行粗分类,将第一层的GMM概率输出作为第二层SVM的输入,用SVM进行环境声音的精细类别划分,构建GMM_SVM双层混合分类模型对复杂环境声音进行分类与识别。本文对鸟类、哺乳动物类、昆虫类这3类30种的复杂环境声音进行研究及对比实验。实验结果表明,本文提出的AED_MWSCC结合GMM_SVM双层混合模型的声音识别方法,具有良好的噪声鲁棒性与分类识别性能,适用于复杂背景噪声下的环境声音识别。
[Abstract]:This paper proposes an adaptive energy detection method based on Mel - scale wavelet packet decomposition subband cepstrum coefficient ( MWSCC ) , which is based on Mel - scale wavelet packet decomposition subband cepstrum coefficient ( MWSCC ) .
【学位授予单位】:福州大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 张宏超;声音识别简介[J];信息与控制;1979年03期
2 刘砾;日研制成功世界上第一个连续声音识别系统[J];国外自动化;1979年Z1期
3 王宪忠;;前景光明的声音识别技术[J];华夏星火;2001年09期
4 郭利刚;方土富;;智能声音识别技术在广播电视广告监测中的应用[J];广播与电视技术;2006年12期
5 施智雄;;基于声音识别的气味发生装置设计与实现[J];电声技术;2009年05期
6 蔡时昊;颜伟国;;智能声音识别技术构建广播电视广告节目监测系统[J];信息通信;2012年03期
7 王再欢;唐云建;韩鹏;;一种利用声音识别的森林盗伐检测方法[J];计算机工程与应用;2012年30期
8 甘振新 ,金世龙;关于声音识别的一些研究课题[J];信息与控制;1979年03期
9 千叶 ,成美 ,刘小立 ,祝景成;声音识别技术的现状与未来[J];国外自动化;1983年02期
10 碧仁 ,陈淑媛;国内外市场大视野[J];现代情报;1993年01期
相关会议论文 前3条
1 杨曜;郭斌;於志文;;一种基于背景声音识别的社会情境感知方法[A];第八届和谐人机环境联合学术会议(HHME2012)论文集PCC[C];2012年
2 张明瀚;石为人;丁宁;;一种基于学习的异常声音识别研究[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
3 高思泽;倪邦发;张贵英;赵常军;肖才锦;刘存兄;刘超;管永精;;过热液滴探测器的声音识别系统设计[A];第十二届全国活化分析学术交流会论文摘要汇编[C];2010年
相关重要报纸文章 前3条
1 日立邋编译;声音识别:下一代手机输入接口[N];中国电子报;2007年
2 本报驻以色列记者 田学科;藏在舌尖上的“身份证”[N];科技日报;2006年
3 李莉;反恐战场另类“灵眼”[N];中国国防报;2004年
相关博士学位论文 前1条
1 张文娟;基于听觉仿生的目标声音识别系统研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
相关硕士学位论文 前10条
1 张楠;西湖之声“杭州味道”品牌战略方案评估和建议[D];浙江大学;2015年
2 张苏楠;基于视频跟踪与多模型声音识别的猪行为检测与分析[D];太原理工大学;2016年
3 张小霞;基于能量检测的复杂环境声音识别[D];福州大学;2014年
4 尤冠瑜;基于时间编码的环境声音识别[D];福州大学;2013年
5 王熙;基于多频段谱减法的鲁棒性生态环境声音识别[D];福州大学;2013年
6 颜鑫;真实噪声下利用抗噪幂归一化倒谱系数的两层鲁棒环境声音识别[D];福州大学;2013年
7 胡志峰;基于嵌入式声音识别技术的列车预警研究[D];西南交通大学;2007年
8 黄伟鸿;工厂噪声环境下声音识别系统的设计与实现[D];中山大学;2014年
9 吴弘;空中目标声音识别技术的研究[D];南京理工大学;2004年
10 曹慧敏;基于海上侦察系统的声音识别技术研究[D];南京理工大学;2010年
,本文编号:1383443
本文链接:https://www.wllwen.com/kejilunwen/wltx/1383443.html