当前位置:主页 > 科技论文 > 信息工程论文 >

基于稀疏表示和深度神经网络模型的西洋乐器自动分类方法

发布时间:2018-03-14 23:05

  本文选题:字典库 切入点:稀疏重构 出处:《南京理工大学》2017年硕士论文 论文类型:学位论文


【摘要】:随着现代社会科技的快速发展,数字音乐的数量也以海量的方式增长,为了方便用户音乐检索,对音乐进行有效合理的分类十分重要。但音乐基数多,每天新的单曲数又不断增加,采取人工的方式对音乐进行分类不切实际。因此,本文采用深度神经网络模型对音乐提取特征实现自动分类。与此同时,由于音乐信号具备稀疏性的特点,本文创新型地提出将稀疏特征与深度神经网络模型相结合的方法,实现音乐信号的自动分类。音乐信号分类标准众多,本文旨在将提出的新方法应用在西洋乐器的自动分类上。本文首先介绍了音乐信号的常见特征,包括基本的物理学特征和人耳感知的心理学角度的特征,与此同时还介绍了人耳听觉系统的特性。接着介绍了音乐自动分类的理论,包含对音乐的特征提取,并着重介绍了本文所采用的深度神经网络模型方面的相关概念。然后研究了音乐信号的稀疏特征提取过程,创新性地引入新型的稀疏表示字典库,该字典库是基于不同乐器发出音色频率间的差异。本文通过MATLAB仿真实验,对比了基于传统字典库和基于本文构建字典库下的稀疏重构结果,证明了基于本文构建字典库下进行稀疏重构效果优于传统字典库。最后本文研究了基于稀疏表示和深度神经网络模型结合的西洋乐器自动分类情况,传统的深度神经网络模型输入端为音频信号的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC),本文创新性地使用音频信号的稀疏特征作为深度神经网络模型输入端,在此基础上训练深度神经网络模型参数,实现西洋乐器的自动分类。本文采用Python脚本语言,通过实验证明了基于稀疏特征和深度神经网络模型相结合的方法,实现西洋乐器自动分类,准确率可达82%。
[Abstract]:With the rapid development of modern social science and technology, the number of digital music is also increasing in a massive way. In order to facilitate users' music retrieval, it is very important to classify music effectively and reasonably. The number of new single songs is increasing every day, so it is impractical to classify music manually. Therefore, the depth neural network model is used to realize the automatic classification of music features in this paper. Due to the sparsity of music signals, this paper proposes an innovative method to combine sparse features with depth neural network model to realize the automatic classification of music signals. The purpose of this paper is to apply the proposed new method to the automatic classification of western musical instruments. This paper first introduces the common features of musical signals, including the basic physical features and the psychological features of human ear perception. At the same time, it also introduces the characteristics of human ear and hearing system, and then introduces the theory of automatic music classification, including the feature extraction of music. Then the sparse feature extraction process of music signal is studied, and a new sparse representation dictionary is introduced. The dictionary is based on the difference of timbre frequency between different musical instruments. This paper compares the sparse reconstruction results based on the traditional dictionary library and the dictionary database based on this paper through MATLAB simulation experiments. It is proved that the effect of sparse reconstruction based on this paper is better than that of traditional dictionary library. Finally, the paper studies the automatic classification of western musical instruments based on sparse representation and depth neural network model. The traditional depth neural network model input end is Mel Frequency Cepstrum efficient Mel frequency cepstrum. In this paper, the sparse feature of audio signal is innovatively used as the input of depth neural network model. On this basis, the parameters of the deep neural network model are trained to realize the automatic classification of western musical instruments. In this paper, the method based on sparse feature and depth neural network model is proved by using Python script language. The automatic classification of western musical instruments is realized, and the accuracy rate is up to 82.
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP183;TN912.3

【相似文献】

相关期刊论文 前10条

1 李映;张艳宁;许星;;基于信号稀疏表示的形态成分分析:进展和展望[J];电子学报;2009年01期

2 赵瑞珍;王飞;罗阿理;张彦霞;;基于稀疏表示的谱线自动提取方法[J];光谱学与光谱分析;2009年07期

3 杨蜀秦;宁纪锋;何东健;;基于稀疏表示的大米品种识别[J];农业工程学报;2011年03期

4 史加荣;杨威;魏宗田;;基于非负稀疏表示的人脸识别[J];计算机工程与设计;2012年05期

5 高志荣;熊承义;笪邦友;;改进的基于残差加权的稀疏表示人脸识别[J];中南民族大学学报(自然科学版);2012年03期

6 朱杰;杨万扣;唐振民;;基于字典学习的核稀疏表示人脸识别方法[J];模式识别与人工智能;2012年05期

7 耿耀君;张军英;袁细国;;一种基于稀疏表示系数的特征相关性测度[J];模式识别与人工智能;2013年01期

8 张疆勤;廖海斌;李原;;基于因子分析与稀疏表示的多姿态人脸识别[J];计算机工程与应用;2013年05期

9 李正周;王会改;刘梅;丁浩;金钢;;基于形态成分稀疏表示的红外小弱目标检测[J];弹箭与制导学报;2013年04期

10 胡正平;赵淑欢;李静;;基于块稀疏递推残差分析的稀疏表示遮挡鲁棒识别算法研究[J];模式识别与人工智能;2014年01期

相关会议论文 前3条

1 何爱香;刘玉春;魏广芬;;基于稀疏表示的煤矸界面识别研究[A];虚拟运营与云计算——第十八届全国青年通信学术年会论文集(上册)[C];2013年

2 樊亚翔;孙浩;周石琳;邹焕新;;基于元样本稀疏表示的多视角目标识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年

3 葛凤翔;任岁玲;郭鑫;郭良浩;孙波;;微弱信号处理及其研究进展[A];中国声学学会水声学分会2013年全国水声学学术会议论文集[C];2013年

相关博士学位论文 前10条

1 李进明;基于稀疏表示的图像超分辨率重建方法研究[D];重庆大学;2015年

2 王亚宁;基于信号稀疏表示的电机故障诊断研究[D];河北工业大学;2014年

3 姚明海;视频异常事件检测与认证方法研究[D];东北师范大学;2015年

4 黄国华;蛋白质翻译后修饰位点与药物适应症预测方法研究[D];上海大学;2015年

5 王瑾;基于稀疏表示的数据收集、复原与压缩研究[D];北京工业大学;2015年

6 王文卿;基于融合框架与稀疏表示的遥感影像锐化[D];西安电子科技大学;2015年

7 解虎;高维小样本阵列自适应信号处理方法研究[D];西安电子科技大学;2015年

8 秦振涛;基于稀疏表示及字典学习遥感图像处理关键技术研究[D];成都理工大学;2015年

9 薛明;基于稀疏表示的在线目标跟踪研究[D];上海交通大学;2014年

10 孙乐;空谱联合先验的高光谱图像解混与分类方法[D];南京理工大学;2014年

相关硕士学位论文 前10条

1 王道文;基于稀疏表示的目标跟踪算法研究[D];华南理工大学;2015年

2 李哲;基于稀疏表示和LS-SVM的心电信号分类[D];河北大学;2015年

3 孙雪青;Shearlet变换和稀疏表示相结合的甲状腺结节图像融合[D];河北大学;2015年

4 吴丽璇;基于稀疏表示的微聚焦X射线图像去噪方法[D];华南理工大学;2015年

5 赵孝磊;基于图像分块稀疏表示的人脸识别算法研究[D];南京信息工程大学;2015年

6 黄志明;基于辨别式稀疏字典学习的视觉追踪算法研究[D];华南理工大学;2015年

7 张铃华;非约束环境下的稀疏表示人脸识别算法研究[D];南京信息工程大学;2015年

8 贺妍斐;基于稀疏表示与自适应倒易晶胞的遥感图像复原方法研究[D];南京信息工程大学;2015年

9 杨烁;电能质量扰动信号的稀疏表示/压缩采样研究[D];西南交通大学;2015年

10 应艳丽;基于低秩稀疏表示的目标跟踪算法研究[D];西南交通大学;2015年



本文编号:1613321

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1613321.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ca108***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com