基于递归图的乐器识别算法
发布时间:2021-12-30 01:24
针对乐器分类问题,基于非线性动力学概念,将不同乐器产生的音频时间序列利用递归图方法进行处理,每组音频时间序列对应得到一张递归图。提取每张递归图的稠密比例不变特征变换(SIFT)特征,通过视觉词袋模型法将高维度的SIFT特征降维,得到每张递归图的视觉单词频率直方图向量作为特征输入线性支持向量机,采用支持向量机(SVM)算法中的"一对多法"实现多分类。实验表明,该方法识别准确率高于递归图密度比特征法,且比基于梅尔频率倒谱系数方法高出3%~4%。为乐器识别提供新思路。
【文章来源】:传感器与微系统. 2020,39(11)CSCD
【文章页数】:4 页
【部分图文】:
乐器识别系统框图
视觉词袋模型算法流程框图
为了让SIFT特征映射到词典中,需使所有SIFT特征矩阵大小一致,并且所提特征能更好地表征递归图信息,因此本文提取的是稠密SIFT特征。稠密SIFT特征与SIFT特征不同的是不需要锁定关键点以及关键点方向,直接把所有SIFT特征点生成特征点描述子[9]。本文在提取稠密SIFT特征点时设置网格间距为2个像素。由于SIFT特征是高维度特征,为减少计算量,利用词袋模型降维。其中词典由文献[10]提供。词袋体现的是SIFT空间顺序信息,若将词袋细分还可以获取空间信息以及局部特征,在本文中,将词袋划分为2×2=4份,再独立计算每1份的频率直方图向量,最后将这4份频率直方图向量依次拼接得到一个大的频率直方图向量,此向量就是送入机器学习中的特征向量。3.3 SVM分类
【参考文献】:
期刊论文
[1]基于SIFT特征的铁路扣件状态检测算法[J]. 赵珊珊,何宁,曹珊. 传感器与微系统. 2018(11)
[2]基于SVM一对一多分类算法的二次细分法研究[J]. 陈中杰,蒋刚,蔡勇. 传感器与微系统. 2013(04)
[3]基于非线性动力学的乐器分类方法[J]. 芮瑞,鲍长春. 电子学报. 2012(07)
硕士论文
[1]基于单音的西洋乐器音色识别方法研究[D]. 后方帅.山东大学 2018
[2]基于声学特征的几种典型乐器识别研究[D]. 任田丽.东北林业大学 2018
[3]基于视觉词袋模型的图像分类研究[D]. 朱道广.解放军信息工程大学 2013
本文编号:3557203
【文章来源】:传感器与微系统. 2020,39(11)CSCD
【文章页数】:4 页
【部分图文】:
乐器识别系统框图
视觉词袋模型算法流程框图
为了让SIFT特征映射到词典中,需使所有SIFT特征矩阵大小一致,并且所提特征能更好地表征递归图信息,因此本文提取的是稠密SIFT特征。稠密SIFT特征与SIFT特征不同的是不需要锁定关键点以及关键点方向,直接把所有SIFT特征点生成特征点描述子[9]。本文在提取稠密SIFT特征点时设置网格间距为2个像素。由于SIFT特征是高维度特征,为减少计算量,利用词袋模型降维。其中词典由文献[10]提供。词袋体现的是SIFT空间顺序信息,若将词袋细分还可以获取空间信息以及局部特征,在本文中,将词袋划分为2×2=4份,再独立计算每1份的频率直方图向量,最后将这4份频率直方图向量依次拼接得到一个大的频率直方图向量,此向量就是送入机器学习中的特征向量。3.3 SVM分类
【参考文献】:
期刊论文
[1]基于SIFT特征的铁路扣件状态检测算法[J]. 赵珊珊,何宁,曹珊. 传感器与微系统. 2018(11)
[2]基于SVM一对一多分类算法的二次细分法研究[J]. 陈中杰,蒋刚,蔡勇. 传感器与微系统. 2013(04)
[3]基于非线性动力学的乐器分类方法[J]. 芮瑞,鲍长春. 电子学报. 2012(07)
硕士论文
[1]基于单音的西洋乐器音色识别方法研究[D]. 后方帅.山东大学 2018
[2]基于声学特征的几种典型乐器识别研究[D]. 任田丽.东北林业大学 2018
[3]基于视觉词袋模型的图像分类研究[D]. 朱道广.解放军信息工程大学 2013
本文编号:3557203
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3557203.html