基于深度学习的主乐器识别方法研究
发布时间:2021-12-29 23:55
为了适应音乐信息检索领域和现实世界对音乐信号中乐器信息的需求,深度学习开始被应用于乐器识别任务。本文以复调音乐中的主乐器识别为研究课题,基于乐器识别理论基础,重点研究卷积神经网络、多任务学习网络结构、复合网络以及损失函数在乐器识别中的作用和效果。论文主要内容分为五部分。作为乐器识别任务的基线,本文详细介绍并分析了用于乐器识别的ConvNet网络,包括实验使用的数据集、网络结构、训练及测试配置和评估参数,使用两种不同的提取特征作为输入数据对ConvNet展开实验并将实验结果作为后续研究的基线。针对起振类型对精度和召回率产生显著影响的问题,本文对ConvNet进行改进,向ConvNet网络引入辅助分类,通过同时执行主分类和辅助分类实现多任务学习。文章通过分析音乐信号设计了基于误判率分析、基于乐器家族和基于起振类型的三种分组策略,基于分组策略获得乐器的组别标签并用于辅助分类。多任务的学习结构可以获得更泛化的表示,并且过拟合和陷入局部最小值的风险较小。对于训练网络使用的损失函数,文章向二元交叉熵中引入中心损失以减小类内间距。为了验证所提出的改进方法的有效性,本文设计了一系列实验对提出的多任务学...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
乐器识别的一般流程
西洋乐器三分类法
振幅随时间变化过程
【参考文献】:
期刊论文
[1]基于深度玻尔兹曼机的乐器分类问题研究[J]. 周畅,米红娟. 计算机应用研究. 2019(07)
[2]结合多尺度时频调制与多线性主成分分析的乐器识别[J]. 王飞,于凤芹. 计算机应用. 2018(03)
[3]An overview of multi-task learning[J]. Yu Zhang,Qiang Yang. National Science Review. 2018(01)
[4]基于相空间重构和柔性神经树的乐器分类[J]. 郅逍遥,李临生,郭喆,郭一娜,闫庆森. 计算机应用与软件. 2015(02)
[5]乐器分类体系[J]. 埃利克·M·冯·霍恩博斯特尔,柯特·萨克斯,安东尼·贝恩斯,克劳斯·P·沃斯曼,刘勇,Hans Sauseng. 中国音乐. 2014(01)
[6]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
本文编号:3557078
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
乐器识别的一般流程
西洋乐器三分类法
振幅随时间变化过程
【参考文献】:
期刊论文
[1]基于深度玻尔兹曼机的乐器分类问题研究[J]. 周畅,米红娟. 计算机应用研究. 2019(07)
[2]结合多尺度时频调制与多线性主成分分析的乐器识别[J]. 王飞,于凤芹. 计算机应用. 2018(03)
[3]An overview of multi-task learning[J]. Yu Zhang,Qiang Yang. National Science Review. 2018(01)
[4]基于相空间重构和柔性神经树的乐器分类[J]. 郅逍遥,李临生,郭喆,郭一娜,闫庆森. 计算机应用与软件. 2015(02)
[5]乐器分类体系[J]. 埃利克·M·冯·霍恩博斯特尔,柯特·萨克斯,安东尼·贝恩斯,克劳斯·P·沃斯曼,刘勇,Hans Sauseng. 中国音乐. 2014(01)
[6]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
本文编号:3557078
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3557078.html