基于ICRNN-GRU异常音频事件检测及增强算法研究
发布时间:2022-07-14 12:10
音频信号作为信息传递的主要途径,相比于视频而言,拥有采集设备简单、方式便捷、所需存储空间小及隐私性高等优点,因此音频监控弥补了视频监控的许多不足,成为安全监控领域关注的焦点。其中,音频事件检测是音频监控的核心技术,即在安全监控中通过音频识别所发生的伴有异常声音的突发异常事件。传统的音频事件检测方法主要用到特征提取方法搭配分类器的方法进行,首先核心的问题仍然是特征提取,经典的音频特征以及针对特定情况人为设计的特征往往过于具体从而并不完整,存在明显缺陷最后导致建模结果偏差。而近年来,深度学习被证明可以有效地应用在音频事件检测领域及提高检测结果。音频事件检测过程中,周围背景声音往往复杂多变且没有规律,这些背景声的出现会明显降低检测性能。本文针对传统音频事件检测方法的不足,在学习、分析深度学习相关知识的基础上,提出了一种将卷积神经网络和循环神经网络相结合的异常音频事件检测模型,并且采用数据增强模块结合基本识别模块的神经网络架构,算法提取异常音频的声谱图作为特征输入,通过数据增强模块获得去噪、增强的特征谱图,然后经由识别模型得出最终识别结果。针对使用深度学习方法在训练异常音频事件检测模型时需要大...
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
说话声原始采样点波形和过零率图
Mel滤波器组示意图
全连接神经网络结构
【参考文献】:
期刊论文
[1]公共安全视频监控地方立法中的个人信息保护研究[J]. 王秀哲. 东北师大学报(哲学社会科学版). 2019(05)
[2]快速傅里叶变换的研究[J]. 陈晋. 黑龙江科学. 2018(24)
[3]基于EEMD的异常声音特征提取[J]. 陈志全,杨骏,乔树山. 计算机与数字工程. 2016(10)
[4]基于窗函数与MATLAB的数字FIR滤波器设计[J]. 董胡. 微型电脑应用. 2016(03)
[5]面向语音情感识别的语谱图特征提取算法[J]. 陶华伟,査诚,梁瑞宇,张昕然,赵力,王青云. 东南大学学报(自然科学版). 2015(05)
[6]基于双门限两级判决的语音端点检测方法[J]. 路青起,白燕燕. 电子科技. 2012(01)
[7]基于倒谱特征的带噪语音端点检测[J]. 胡光锐,韦晓东. 电子学报. 2000(10)
本文编号:3661102
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
说话声原始采样点波形和过零率图
Mel滤波器组示意图
全连接神经网络结构
【参考文献】:
期刊论文
[1]公共安全视频监控地方立法中的个人信息保护研究[J]. 王秀哲. 东北师大学报(哲学社会科学版). 2019(05)
[2]快速傅里叶变换的研究[J]. 陈晋. 黑龙江科学. 2018(24)
[3]基于EEMD的异常声音特征提取[J]. 陈志全,杨骏,乔树山. 计算机与数字工程. 2016(10)
[4]基于窗函数与MATLAB的数字FIR滤波器设计[J]. 董胡. 微型电脑应用. 2016(03)
[5]面向语音情感识别的语谱图特征提取算法[J]. 陶华伟,査诚,梁瑞宇,张昕然,赵力,王青云. 东南大学学报(自然科学版). 2015(05)
[6]基于双门限两级判决的语音端点检测方法[J]. 路青起,白燕燕. 电子科技. 2012(01)
[7]基于倒谱特征的带噪语音端点检测[J]. 胡光锐,韦晓东. 电子学报. 2000(10)
本文编号:3661102
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3661102.html