面向声音事件的特征提取与识别方法研究
发布时间:2021-01-22 13:17
由特定物理事件引起的声波可以称为声音事件。对声音事件的特征提取和识别,可以帮助我们确定声音事件的类型,获取环境信息,从而指导生产和生活。声音事件识别过程分为特征提取和分类识别两个部分,现在主流的特征提取方法以传统语音特征为主,对声音事件的特征提取缺乏针对性。此外,由于声音事件受环境因素影响大,传统的分类器或分类算法难以对复杂的声音事件进行特征挖掘,在分类问题中表现一般。基于神经网络的分类模型效果较好,然而对训练样本的数量要求很高,难以在有限的数据集支撑下获得良好的识别效果。为此,本文在对声音特征提取与分类器设计的研究基础上,提出将样本扩增和数据增强方法同时应用到声音事件识别中,为声音事件分类识别研究提供一种新的方法。本文选取生活环境中常见的动物的声音、自然声景和水声、人类的非语音声、室内或家庭声音、户外或城市噪音等5大类50小类非语音声音事件为主要研究对象,使用音频录音文件作为声音数据集。本文在声音事件识别基本原理的基础上,设计了基于谐波分量和冲激分量分解的多种特征组合的特征表示方法,样本扩增和数据增强方法,以及基于残差神经网络的声音事件识别总体方案。首先对单通道音频文件进行谐波分量和...
【文章来源】: 李阳 电子科技大学
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
原始音频、谐波分量、冲激分量的时域图
电子科技大学硕士学位论文22图3-2原始音频、谐波分量、冲激分量的时域图图3-3原始音频、谐波分量、冲激分量的梅尔谱图图3-2和图3-3分别为原始音频经HPSS后的时域图和梅尔谱图。可以看到经
电子科技大学硕士学位论文26图3-6快速傅里叶变换点数为1024时的特征谱图图3-7快速傅里叶变换点数为2048时的特征谱图可以看到,选取不同的窗长,在梅尔谱图及其一阶和二阶差分图的特征细节上有所区别,二者有共同之处,也存在信息的互补。
本文编号:2993294
【文章来源】: 李阳 电子科技大学
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
原始音频、谐波分量、冲激分量的时域图
电子科技大学硕士学位论文22图3-2原始音频、谐波分量、冲激分量的时域图图3-3原始音频、谐波分量、冲激分量的梅尔谱图图3-2和图3-3分别为原始音频经HPSS后的时域图和梅尔谱图。可以看到经
电子科技大学硕士学位论文26图3-6快速傅里叶变换点数为1024时的特征谱图图3-7快速傅里叶变换点数为2048时的特征谱图可以看到,选取不同的窗长,在梅尔谱图及其一阶和二阶差分图的特征细节上有所区别,二者有共同之处,也存在信息的互补。
本文编号:2993294
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2993294.html