基于深度神经网络的音频事件检测
本文关键词:基于深度神经网络的音频事件检测
更多相关文章: 音频事件检测 深度神经网络 深层变换特征 分类器
【摘要】:随着互联网技术的快速发展及手持录音设备的普及,人们可获取的音频数据呈爆炸式增长。为了有效管理、利用海量音频数据,音频检索技术成为研究热点。音频事件检测是音频检索的重要组成部分,其主要任务是将连续音频流中感兴趣的音频事件检测出来。本文采用深度神经网络(Deep Neural Network,DNN)作为深层特征提取器和音频事件分类器,提出一种基于深度神经网络的音频事件检测框架,并比较不同音频特征及分类器在复杂音频事件检测中的性能差异。本文主要工作及贡献如下:(1)针对传统音频特征不能有效刻画复杂音频事件之间差异的问题,提出一种基于多流多层深度神经网络的复杂音频事件深层变换特征提取方法。首先以传统音频特征分别作为第一层深度神经网络的输入并将该层深度神经网络瓶颈层的输出作为第二层深度神经网络的输入,然后将第二层深度神经网络瓶颈层的输出作为深层变换特征。多个传统音频特征经过多流多层深度神经网络学习变换之后,最终得到的音频特征融合了传统音频特征的优势并进一步挖掘了新的输入特征信息。采用取自BBC音频事件数据库和影视剧音频事件数据库的实验数据进行测试,实验结果表明:与目前被广泛使用的梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和Gabor特征相比,本文提取的特征在区分复杂音频事件时获得更好的分类效果。(2)将深度神经网络作为音频事件分类器并结合(1)中提取的深层变换特征,提出一种基于深度神经网络的音频事件检测方法,并深入探讨深层变换特征在音频事件检测时的抗噪性。该方法将深度神经网络既作为特征提取器又作为分类器,旨在利用深度神经网络的数据学习能力获得更优的音频事件检测性能。采用取自BBC音频事件数据库和影视剧音频事件数据库的实验数据进行测试,实验结果表明:与目前基于高斯混合模型、基于隐马尔科夫模型和基于支持向量机的音频事件检测方法相比,本文方法获得了更好的检测结果。采用带有Babble噪声、Destroyerops噪声、F16噪声和Factory1噪声的影视剧音频事件数据集依次进行测试,深层变换特征比MFCC特征的平均F1值分别提高9.08%、12.01%、6.79%和13.64%;比Gabor特征的平均F1值分别提高5.39%、3.56%、4.75%和3.26%。采用带有Babble噪声、Destroyerops噪声、F16噪声和Factory1噪声的BBC音频事件数据集依次进行测试,深层变换特征比MFCC特征的平均F1值分别提高8.77%、10.64%、8.76%和10.40%;比Gabor特征的平均F1值分别提高11.19%、6.29%、7.04%和6.99%。上述结果表明:深层变换特征比MFCC特征、Gabor特征具有更好的抗噪性。综上所述,本文基于深度神经网络深入探讨音频事件深层变换特征提取方法及检测方法。实验分析深层变换特征与传统音频特征、本文检测方法与传统检测方法的性能差异,验证了本文的深层变换特征及音频事件检测方法的有效性。
【关键词】:音频事件检测 深度神经网络 深层变换特征 分类器
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3;TP183
【目录】:
- 摘要5-7
- Abstract7-11
- 第一章 绪论11-17
- 1.1 研究背景与意义11-12
- 1.2 国内外研究现状12-14
- 1.3 论文主要研究内容14-15
- 1.4 论文结构安排15-17
- 第二章 音频事件检测理论基础17-34
- 2.1 常用特征17-21
- 2.1.1 梅尔频率倒谱系数17-18
- 2.1.2 Gabor特征18-21
- 2.2 常用分类器21-33
- 2.2.1 高斯混合模型21-25
- 2.2.2 隐马尔科夫模型25-29
- 2.2.3 支持向量机29-33
- 2.3 本章小结33-34
- 第三章 基于多流多层深度神经网络的深层特征提取34-53
- 3.1 神经网络发展34-35
- 3.2 深度神经网络基本原理35-39
- 3.2.1 DNN数学表达式35-36
- 3.2.2 随机梯度下降算法36-37
- 3.2.3 受限玻尔兹曼机37-39
- 3.3 深层变换特征提取框架39-41
- 3.3.1 深度神经网络参数初始化40-41
- 3.3.2 深层变换特征提取41
- 3.4 实验设计41-45
- 3.4.1 实验数据42-43
- 3.4.2 浅层音频特征选取43-44
- 3.4.3 实验设置44
- 3.4.4 评价指标44-45
- 3.5 实验结果分析45-52
- 3.5.1 隐层数对特征分类性能影响45-47
- 3.5.2 各种特征分类性能比较47-52
- 3.6 本章小结52-53
- 第四章 基于深度神经网络的音频事件检测53-70
- 4.1 音频事件检测思想53
- 4.2 音频事件检测框架53-54
- 4.3 实验设计54-58
- 4.3.1 实验数据55-57
- 4.3.2 评价指标57-58
- 4.3.3 实验设置58
- 4.4 实验结果分析58-69
- 4.4.1 DNN分类器结构确定58-59
- 4.4.2 不同分类器检测结果对比59-60
- 4.4.3 不同特征鲁棒性对比60-69
- 4.5 本章小结69-70
- 结论70-72
- 参考文献72-79
- 攻读硕士学位期间取得的研究成果79-80
- 致谢80-82
- 附件82
【相似文献】
中国期刊全文数据库 前10条
1 洪宇;张宇;范基礼;刘挺;李生;;基于子话题分治匹配的新事件检测[J];计算机学报;2008年04期
2 史新宏,蔡伯根;高速公路自动事件检测算法[J];交通运输系统工程与信息;2001年04期
3 周林英;朱斌;赵忠杰;;基于支持向量机的高速公路事件检测算法[J];系统仿真技术;2010年03期
4 陈艳艳;田启华;;公交调度系统事件检测算法研究[J];北京工业大学学报;2011年12期
5 郝艳哲;;京秦高速公路视频事件检测系统应用[J];中国交通信息化;2013年04期
6 王闯舟;;提升事件检测的商业价值[J];软件世界;2007年20期
7 王彩琴;;基于智能分析的高速公路事件检测系统的研究与开发[J];浙江统计;2007年11期
8 王颖颖;张峗;胡乃静;;在线新事件检测系统中的性能提升策略[J];计算机工程;2008年15期
9 仓玉;洪宇;姚建民;朱巧明;;基于时序话题模型的新事件检测[J];智能计算机与应用;2011年03期
10 楼晓俊;鲍必赛;刘海涛;;分布式信息融合的物联网事件检测方法[J];南京邮电大学学报(自然科学版);2012年01期
中国重要会议论文全文数据库 前10条
1 洪宇;张宇;范基礼;刘挺;李生;;基于子话题分治匹配的新事件检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 刘霄;邵健;庄越挺;;基于主题模型的网络突发热点事件检测[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
3 胡佳锋;金蓓弘;陈海彪;;空间事件检测的加速策略研究[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 万涛;陈学武;王川久;;高速公路事件自动检测算法研究综述[A];第一届中国智能交通年会论文集[C];2005年
5 张阔;李涓子;吴刚;;基于关键词元的话题内事件检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 覃频频;许登元;姚起宏;黄大明;;基于表决融合的高速公路事件检测算法融合[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
7 陈俊;李国辉;;拥挤视频监控中的事件检测[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
8 张永忠;赵静;;基于事件检测算法的交通数据分析系统[A];中国计量协会冶金分会2008年会论文集[C];2008年
9 刘海龙;李战怀;陈群;;RFID供应链系统中的在线复杂事件检测方法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
10 周春姐;孟小峰;文洁;;Flickr中的复合事件检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
中国重要报纸全文数据库 前2条
1 王闯舟;事件检测提升服务的商业价值[N];计算机世界;2006年
2 杭州海康威视数字技术股份有限公司 浦世亮;IVS技术在城市安防系统中的应用[N];计算机世界;2008年
中国博士学位论文全文数据库 前4条
1 刘昌余;多媒体事件检测中的关键技术研究[D];华南理工大学;2015年
2 覃频频;基于信息融合的高速公路事件检测建模与仿真[D];西南交通大学;2007年
3 余柳;基于移动源数据的城市快速交通事件检测W-CUSUM算法与评价[D];北京交通大学;2010年
4 柯佳;基于语义的视频事件检测分析方法研究[D];江苏大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙方园;基于图的中文微博灾难事件检测[D];浙江大学;2016年
2 赵伟;足球视频精彩事件检测算法研究[D];北京理工大学;2016年
3 张玉;基于微博的突发事件检测方法研究[D];兰州大学;2016年
4 吴维耀;制造业物联网基于事件优先级的复杂事件检测方法研究[D];广东工业大学;2016年
5 金海;基于深度神经网络的音频事件检测[D];华南理工大学;2016年
6 李红梅;基于微博的突发事件检测研究[D];南京理工大学;2016年
7 周林英;基于支持向量机的高速公路事件检测算法[D];长安大学;2009年
8 熊伟晴;基于位置信息的事件检测[D];哈尔滨工业大学;2015年
9 肖军;基于车检器数据的高速公路事件检测可靠性提升技术研究[D];重庆大学;2015年
10 龙睿;针对微博数据的事件检测、跟踪及摘要生成[D];上海交通大学;2012年
,本文编号:1101433
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1101433.html