基于MFCC,MODGDF和支持向量机的环境音识别研究
发布时间:2020-12-19 23:07
环境音识别是机器学习领域中的一个研究重点和难点,它可以帮助智能系统识别音频数据中的环境音。本文提出一种新的环境音识别方法,它是将梅尔频率倒谱系数(mel frequency cepstral coefficents,MFCC)和修正群延迟函数(modified group delay function,MODGDF)联合作为特征参数,然后利用多分类支持向量机(support vector machine,SVM)进行参数分类,达到识别音频数据中环境音的目的。结果表明,在DCASE 2018数据集上,该方法的实验效果优于DCASE 2018数据集基线系统识别效果,整体识别准确率提高了25.8%。
【文章来源】:河南理工大学学报(自然科学版). 2020年06期 北大核心
【文章页数】:6 页
【文章目录】:
0 引 言
1 相关工作
2 识别原理及流程
3 特征提取及分类
3.1 MFCC特征提取
3.2 MODGDF特征提取
3.3 PCA降维
3.4 SVM特征分类
4 结果与分析
4.1 数据集的选择
4.2 实验方法
4.3 实验结果
5 结 论
本文编号:2926736
【文章来源】:河南理工大学学报(自然科学版). 2020年06期 北大核心
【文章页数】:6 页
【文章目录】:
0 引 言
1 相关工作
2 识别原理及流程
3 特征提取及分类
3.1 MFCC特征提取
3.2 MODGDF特征提取
3.3 PCA降维
3.4 SVM特征分类
4 结果与分析
4.1 数据集的选择
4.2 实验方法
4.3 实验结果
5 结 论
本文编号:2926736
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2926736.html