当前位置:主页 > 文艺论文 > 民族器乐论文 >

基于深度学习的乐器分类方法研究

发布时间:2020-11-09 16:25
   基于深度学习的乐器分类问题是深度学习在音乐信息检索方向上的应用,而音乐信息检索又是语音识别领域近年来备受关注的研究热点。首先,介绍音乐分类及深度学习领域的基本理论知识,为混合模型的搭建做好理论铺垫。其次,对用于构建深度学习混合模型的深度自编码器(DAE)与深度玻尔兹曼机(DBM)进行重点介绍,包括模型的基本结构、训练算法、性能特征及研究现状等。基于DAE的数据扩充能力与DBM的数据投影能力,构建混合深度学习模型DA-BM;通过在参数调整过程中加入动量项的方式缓解模型训练中的震荡现象,同时引入平均场来平滑训练数据中的孤立点,提升模型的鲁棒性。DA-BM在乐器分类任务中充当特征提取器,分别在模型顶层设置SVM与Softmax分类器,实现对乐器音频数据的分类。另外,基于PLP系数能够模拟人耳听觉特性的优势,结合谱通量特征能够反映音乐信号中相邻两帧间能量变化关系的特性,提出一种新的混合特征量。最后,通过仿真实验对本文提出的DA-BM混合模型以及混合特征量进行有效性验证。将DA-BM模型应用于5类单乐器音频数据的分类任务,并与传统音乐分类方法及单一深度学习模型进行性能比较。实验结果表明,在同一测试集上,混合模型DA-BM的分类准确率高于深度学习单模型DAE与DBM。同时,DA-BM、DAE、DBM三种深度学习模型在乐器分类任务中的分类性能明显优于浅层模型SVM,分类准确率提升超过10%。另外,提取音乐数据的能量特征、MFCC系数、PLP系数并构建基于PLP系数和谱通量的混合特征。分别采用上述特征作为DA-BM模型的输入,对比不同特征量的性能。实验结果表明混合特征量表现最优异,分类准确率达到91.25%,证明本文提出的混合特征量具有更强的数据表达能力。
【学位单位】:兰州财经大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP181;J60-4
【部分图文】:

层次结构图,层次结构图,无监督,音乐情感


的音乐推荐以及音乐情感分析等。对此,无监督训练具有很强的适,并不是所有的深度学习模型都进行无监督训练,但在网络中存在据的情况下,深度学习方法是极具竞争力的一种尝试。学习的常见模型尔兹曼机兹曼机(RBM)是一种无监督模型,RBM 网络的每一个子模块包可视层 V,其中的节点数据 V=(0v ,1v ,···,mv )一般服从伯努利分布以及隐藏层 H,隐藏单元中的数据 H=(0h ,1h ,···,nh )一般服从伯努一层次中的节点彼此独立,而两个层次之间的各节点则两两相连图 2.2 所示。···

网络结构图,二值变量,可视,高斯


量转换成为取值仅为 0 和 1 的随机二值变量,接着由网络中更高层伯努利 RBM 或者伯努利-高斯 RBM 进行信息的特征提取,而在 DB选择使用伯努利-高斯 RBM 模型,将二值变量再转换为实值变量,息进行解释。上述形式的 DBN 模型常被用于提取语音信息中的深深度玻尔兹曼机玻尔兹曼机(DBM)与深度信念网络在结构上很相似,但在可视连接方式上存在差异。DBM 的本质仍然是 RBM,只是增加了单个 R个数,如图 2.3(b)所示。而 DBN 在靠近输入层和远离输入层的位同,靠近可视层的一段采用的是有向图模型,箭头由隐藏层指向可视视层的一端则采用 RBM。DBM 与 RBM 的区别可参照图 2.3。

重构误差,原始信息,隐藏层,解码器


自动编码器动编码器(AE)是一个包含了输入层、隐含层以及输出层的三,由 Rumelhart[50]在 1986 年首次提出。在该结构中,原始信息通过码器的编码操作传递至隐藏层,编码后的信息再经过解码器的解出层,而输出的结果就是原始信息的重构。最小化重构信息与原是优化自动编码器算法的首要目标,往往通过定义一个重构误差型性能的重要指标。如果重构误差很小(小于某个阈值),则重完全对应于原始信息,此时经编码后的信息就是能够充分表达原征量,将该特征量作为下一层的输入,以此类推,完成整个网络程中通过调整编码器与解码器的参数值使模型达到重构误差最小确定后,由隐藏层到输出层的参数值将直接被释放。自动编码器图 2.4 所示。
【相似文献】

相关期刊论文 前10条

1 吕月坪;;一种基于六维打分的混合模型业务推荐系统[J];福建电脑;2017年03期

2 戴妙林;郭震;秦俊德;;位移混合模型的改进[J];河海大学学报;1992年06期

3 李腊元;适于通信协议形式描述的一种混合模型[J];计算机学报;1988年05期

4 李旦江,杨立新,顾宁;混合模型及其在恒山拱坝原观资料分析中的应用[J];水力发电;1988年05期

5 卢有清,吴中如;混凝土重力坝变形的混合模型及其应用研究[J];大坝与安全;1989年03期

6 李腊元;通信协议形式描述的一种混合模型研究[J];计算机工程与设计;1989年01期

7 李腊元;;局部网络通信协议形式描述的新混合模型[J];武汉水运工程学院学报;1989年03期

8 漆德威;郑希特;;U(1)格点混合模型相图的解析研究[J];成都科技大学学报;1989年03期

9 包振华;宋晓琳;;广义指数-帕累托(Ⅳ)混合模型[J];辽宁师范大学学报(自然科学版);2018年01期

10 潘迪夫;陈军;鲍天哲;韩锟;;多输出支持向量机混合模型在机车调簧中的应用[J];华南理工大学学报(自然科学版);2018年04期


相关博士学位论文 前10条

1 陈思宝;基于t-混合模型和扩展保局投影的聚类与降维方法研究[D];安徽大学;2006年

2 凌晓亮;混合模型中的随机比较[D];兰州大学;2013年

3 李炜;多种混合模型下的盲信号分离方法研究[D];江南大学;2014年

4 聂伟;不同混合模型下非平稳信号的分离与提取[D];哈尔滨工程大学;2017年

5 彭伟才;基于混合模型的中频振动声学分析[D];华中科技大学;2010年

6 熊太松;基于统计混合模型的图像分割方法研究[D];电子科技大学;2013年

7 兰永红;基于二维模型的重复控制系统分析与设计[D];中南大学;2010年

8 吴小霞;多重检验中FDR方法及其参数估计问题的研究[D];武汉大学;2010年

9 杨萌;基于Taxonomy-folkonomy混合模型的社会化标注系统资源聚合研究[D];吉林大学;2014年

10 王洪武;基于非线性理论的古诺—伯川德混合模型研究及应用[D];天津大学;2013年


相关硕士学位论文 前10条

1 赵佳;炼钢流程能耗的控制与调动集成优化方法研究[D];东北大学;2015年

2 周畅;基于深度学习的乐器分类方法研究[D];兰州财经大学;2018年

3 孔德萌;基于混合模型CI-FPA-SVM对PM日浓度预测[D];兰州大学;2018年

4 雷昌宁;基于SARIMA和SVR混合模型的黑河径流量预测分析[D];兰州大学;2018年

5 徐晓梅;基于混合模型EWT-PSO-SA-SVR的港口吞吐量区间预测[D];兰州大学;2018年

6 李艺;基于混合模型SSA-ICEEMD-CS-LSSVR的港口集装箱吞吐量预测[D];兰州大学;2018年

7 张宇超;基于矩阵正态混合模型的模糊聚类算法研究[D];云南财经大学;2018年

8 王骞;云平台下基于混合模型的网络负载资源预测[D];陕西师范大学;2018年

9 张丹峰;基于LightGBM,XGBoost,ERT混合模型的风机叶片结冰预测研究[D];上海师范大学;2018年

10 张海洋;混合模型软测量建模方法及其在发酵过程中的应用[D];江苏大学;2017年



本文编号:2876681

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/mzqiyue/2876681.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户10ad9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com