当前位置:主页 > 科技论文 > 自动化论文 >

声音事件分类与检测的半监督学习方法研究

发布时间:2021-01-20 20:27
  声音事件检测是对一段音频检测包含的声音事件和发生位置的技术,声音事件分类则只需获得事件类别信息。这一技术是获取周围环境信息不可缺少的手段,特别在某些特定环境,例如黑暗环境,有着独特的优势。近年来,随着Google发布大型音频事件数据集AudioSet,声音事件检测使用神经网络变成了可能,越来越多的研究者开始关注这一方向,声音事件检测的发展迎来了新局面。但是,不可否认,声音事件检测还面临许多困难。一方面,声音事件的复杂多变,甚至会出现同一时刻发生多个事件的情况,这无疑对检测系统提出了很高的要求。另一方面,具有完善标签的数据集代价昂贵,很难获得,AudioSet是只含有事件类别的弱标签数据集,利用这样的数据甚至是无标签数据得到可用的检测系统也是一项极具挑战性的任务。如今声音事件检测技术还出初步发展阶段,距离真正实用的成熟系统还有许多问题亟待解决。本文主要针对上述两个难点进行研究,首先搭建基于卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)的声音事件分类与检测系统,该系统使用弱标签数据进行训练。在此基础上,为提取更加具有区分性的特征引... 

【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

声音事件分类与检测的半监督学习方法研究


图1.2声音事件分类与检测系统流程??

激活函数


??x?_?-x??tanh(jc)?=?—?(2.2)??ex?+e'x??ReLU(jc)?=?max(jc,0)??sigm?tanh?ReLU??2i??2.??2.?-T.??1?.一?」?1?—?1?/??_,?/??〇?o?〇?????y??-1?-1?—^?-1??-2????????**2?????-?-???-2??"-—??????-2-1012?-2-1012?-2-1012??图2.1常用激活函数??10??

动量,卷积,神经网络


?第2章声音事件分类与检测研宄理论基础???度下降算法,减少网络学习的震荡效应,收敛速度快,收敛性更好。??图2.2内斯特洛特动量??2.?1.2卷积神经网络??卷积神经网络是深度学习领域性能强大的网络之一,在物体检测,语音识??别等领域大放异彩,取得许多令人瞩目的成就。1962年,Hubei以及Wiesel[59]??通过对猫的视觉系统研宄提出视网膜是通过多层次感受野激发将视觉信息传递??到大脑,基于此提出感受野的概念,这对卷积神经网络的出现有着重要的意义。??1980年,日本研究者Fukushima[60]依据此研宄理论提出神经认知机,将视觉系??统模型化,被认为是早期卷积神经网络。到上世纪九十年代,深度学习三巨头??之一YanLeCUn[61]提出LeNet,其是对手写字元识别分类的卷积神经网络,正??确率高达98°/。,在美国金融领域中成功投入使用,用来识别美国,加拿大约10%??的支票。Yan?LeCun也被称为是卷积神经网络之父,为卷积神经网络爆发式的??研究与应用奠定基矗进入新世纪,出现了?AlexNet[62],VGG[63],??GoogleNet[64],?ResNet[65],?DenseNet[66]等一系列基于卷积神经网络的结构,??极大地促进其商业化应用,走入人们的生活。??C3:?f.?maps?16@10x10??INP丨丨T?C1:?feature?maps?S4:f.?maps?16@5x5??32x32?一'?f|L???w????圆111?,.....―…麗??i?Fuil?connection?Gaussian?connections??Convolutio


本文编号:2989731

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2989731.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4c5ca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com