美尔谱系数与卷积神经网络相组合的环境声音识别方法
发布时间:2021-02-11 00:34
通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将构建的卷积神经网络模型与随机森林、支持向量机(SVM)、深度神经网络(DNN)及DCASE比赛中常用的三种识别模型进行对比实验。实验结果表明,在相同数据集下,本文所设计的美尔谱系数与卷积神经网络相组合的环境声音识别方法相较传统的声音识别方法在识别率上分别有13.1%,18.3%,15.7%的提升,相较于DCASE比赛中的三种常用识别模型,本文所设计识别模型识别率及识别效率均有明显的优势。
【文章来源】:信号处理. 2020,36(06)北大核心
【文章页数】:9 页
【部分图文】:
美尔谱系数与卷积神经网络相组合的
MFSC特征提取过程
(5)输出层将神经网络模型训练或测试的结果输出,使模型与数据直观化,同时可以根据结果通过调整模型参数、更换损失函数、调整优化器和模型结构等手段来重新构建训练模型。本文所构建的模型结构如图3所示,包括卷积层、池化层、全局平均池化和全连接层。提取的MFSC特征参数作为输入层的输入,将其转化为矩阵,使用卷积核对其进行卷积,从而得到卷积之后的特征。本模型中第l层卷积层的第i个特征图是x i l ,前一层卷积层的第j个特征图为x j l-1 。x i l 的计算如公式(6)所示:
本文编号:3028235
【文章来源】:信号处理. 2020,36(06)北大核心
【文章页数】:9 页
【部分图文】:
美尔谱系数与卷积神经网络相组合的
MFSC特征提取过程
(5)输出层将神经网络模型训练或测试的结果输出,使模型与数据直观化,同时可以根据结果通过调整模型参数、更换损失函数、调整优化器和模型结构等手段来重新构建训练模型。本文所构建的模型结构如图3所示,包括卷积层、池化层、全局平均池化和全连接层。提取的MFSC特征参数作为输入层的输入,将其转化为矩阵,使用卷积核对其进行卷积,从而得到卷积之后的特征。本模型中第l层卷积层的第i个特征图是x i l ,前一层卷积层的第j个特征图为x j l-1 。x i l 的计算如公式(6)所示:
本文编号:3028235
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3028235.html