基于深度学习的哼唱音频乐谱识别技术研究
【图文】:
逡逑总体的技术路线如图1.1所示。逡逑哼唱音频数据集逡逑0邋0邋0逡逑DSD100邋MedleyDB邋自行录制逡逑逦邋Y逡逑哼唱音频处理逡逑y逡逑哼唱识别神经网络模型逡逑卷积层邋循环层邋批量归一化逡逑ReLU逦Dropout邋?邋?邋?逡逑逦邋逦^邋r逦逡逑卜此恮叫逦,目鸭识别.逡逑Bottle邋框架逦^逦Web邋服务逦逦逡逑逦?哼唱识别系统逡逑React邋Native框架逦^邋D邋SSffl邋H逡逑图1.1本文技术路线逡逑1.4论文组织结构逡逑本文主要研究基于深度学习的哼唱音频识别问题,将阐述研宄中使用到的相逡逑关技术的原理和理论基础、实验使用的网络模型以及实验和结果分析。论文分为逡逑六个章节,每章的内容如下:逡逑第一章绪论,提出论文的研究背景和研究意义,分析国内外当前的研究情况,逡逑介绍本文的研究目标和研宄内容,制定整体的技术路线。逡逑第二章为论文的理论基础,概括了深度学习的概念,介绍了深度学习研宄的逡逑一般方法及其应用,重?
TensorFlow还具备高度移植性,基于TensorFlow编写的代码可以在几乎不逡逑经过修改的情况下,部署到多种终端上,即使不同设备可能拥有不同的CPU或逡逑GPU数量、不同的操作系统和硬件环境。同时TensorFlow的编译速度极快,在逡逑探索网络结构设计时,付出的时间代价非常小。逡逑2.5.2邋Caffe逡逑Caffe是一个被广泛使用的开源深度学习框架,由伯克利视觉学中心进行维逡逑护。Caffe的主要优势包括:逡逑(1)可以快速开始,网络结构都是以配置文件形式定义,不需要用代码设逡逑计网络。逡逑(2)拥有大量训练好的经典模型。逡逑(3)高度模块化的算法,扩展性和可重用性高。逡逑Caffe的核心概念是Layer,,每一个神经网络的模块都是一个Layer,Layer逡逑接收输入数据,同时经过内部计算产生输出数据,设计网络结构时,只需要通过逡逑配置文件把各个Layer拼接在一起构成完成的网络[4()]。如图2.4所示,展示了一逡逑
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:J613.2;TP181
【参考文献】
相关期刊论文 前8条
1 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
2 曹辉;徐晨;赵晓;吴胜举;;说话人识别中的Mel特征频率倒谱系数[J];西北大学学报(自然科学版);2013年02期
3 侯珏;刘轶;郑方;蒋丹宁;秦勇;黄石磊;刘勇;;基于VP树结构的多层匹配算法在哼唱识别中的应用[J];清华大学学报(自然科学版);2009年S1期
4 曹文晓;刘轶;郑方;蒋丹宁;秦勇;;用于哼唱识别精确匹配的线性伸缩动态规划算法[J];清华大学学报(自然科学版);2009年S1期
5 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期
6 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
7 覃光华,丁晶,陈彬兵;预防过拟合现象的人工神经网络训练策略及其应用[J];长江科学院院报;2002年03期
8 刘曙光;郑崇勋;刘明远;;前馈神经网络中的反向传播算法及其改进:进展与展望[J];计算机科学;1996年01期
相关硕士学位论文 前5条
1 王公友;基于内容的音频分析与场景识别[D];南京大学;2013年
2 王京辉;语音信号处理技术研究[D];山东大学;2008年
3 李晨;结合语音识别技术的音乐哼唱检索研究[D];西北大学;2008年
4 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年
5 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年
本文编号:2683660
本文链接:https://www.wllwen.com/wenyilunwen/mzqiyue/2683660.html