当前位置:主页 > 文艺论文 > 民族器乐论文 >

基于深度学习的哼唱音频乐谱识别技术研究

发布时间:2020-05-27 14:21
【摘要】:哼唱识别是当前音乐信息提取研究中的一大热点,其目标是根据用户的哼唱,识别出用户哼唱的歌曲。由于其交互形式友好,在移动设备上使用便利,相关技术在音乐检索、音乐推荐等领域具有广阔的应用前景。本文针对哼唱音频信号自动识别问题,研究了深度学习研究中常用方法和手段,将深度学习方法应用到哼唱识别中,结合传统音频信号处理方法,提出了一种基于深度学习框架的识别方法,设计了一个哼唱音频识别深度学习框架,实现对人声哼唱的音乐信号进行识别。本文还基于此实现了一个具有实用价值、可扩展性强的哼唱音频乐谱识别系统,通过实验验证了所提出的基于深度学习的哼唱识别算法的可行性。论文的研究工作主要包括:(1)研究了哼唱音频数据处理方法,包括音频滤波、预加重、加窗分帧、音符起始点检测、音频信号特征表示等方法,对比了不同方法之间的区别和优缺点,针对深度学习数据集的要求选取了合适的方法进行深入研究和实践。(2)深入研究了当前深度学习研究的理论基础与常用方法,包括常用神经网络的设计与训练方法,应用广泛的各类神经网络结构的原理与优缺点等。基于此设计了一个卷积循环神经网络模型,结合卷积神经网络在局部特征提取和循环神经网络在归纳序列数据特征方面的优势,提高哼唱音频信号识别的准确率。(3)利用开源深度学习平台与工具,对所提出的神经网络模型进行了实验与论证。通过在测试数据集上进行训练和测试,反复调整模型,得到了效果较好的模型参数。并通过在测试数据集上的评估测试,验证了所提出的神经网络模型的可行性和有效性,并对模型性能进行了分析和评估。(4)基于所提出的深度学习框架,利用服务端和移动端开发技术,设计实现了一个哼唱音频乐谱识别原型系统,包括服务端的音频识别服务、移动端的音频录制、音频上传等功能模块。
【图文】:

识别问题,技术路线,论文,音频


逡逑总体的技术路线如图1.1所示。逡逑哼唱音频数据集逡逑0邋0邋0逡逑DSD100邋MedleyDB邋自行录制逡逑逦邋Y逡逑哼唱音频处理逡逑y逡逑哼唱识别神经网络模型逡逑卷积层邋循环层邋批量归一化逡逑ReLU逦Dropout邋?邋?邋?逡逑逦邋逦^邋r逦逡逑卜此恮叫逦,目鸭识别.逡逑Bottle邋框架逦^逦Web邋服务逦逦逡逑逦?哼唱识别系统逡逑React邋Native框架逦^邋D邋SSffl邋H逡逑图1.1本文技术路线逡逑1.4论文组织结构逡逑本文主要研究基于深度学习的哼唱音频识别问题,将阐述研宄中使用到的相逡逑关技术的原理和理论基础、实验使用的网络模型以及实验和结果分析。论文分为逡逑六个章节,每章的内容如下:逡逑第一章绪论,提出论文的研究背景和研究意义,分析国内外当前的研究情况,逡逑介绍本文的研究目标和研宄内容,制定整体的技术路线。逡逑第二章为论文的理论基础,概括了深度学习的概念,介绍了深度学习研宄的逡逑一般方法及其应用,重?

可视化,配置文件,视觉学,代码


TensorFlow还具备高度移植性,基于TensorFlow编写的代码可以在几乎不逡逑经过修改的情况下,部署到多种终端上,即使不同设备可能拥有不同的CPU或逡逑GPU数量、不同的操作系统和硬件环境。同时TensorFlow的编译速度极快,在逡逑探索网络结构设计时,付出的时间代价非常小。逡逑2.5.2邋Caffe逡逑Caffe是一个被广泛使用的开源深度学习框架,由伯克利视觉学中心进行维逡逑护。Caffe的主要优势包括:逡逑(1)可以快速开始,网络结构都是以配置文件形式定义,不需要用代码设逡逑计网络。逡逑(2)拥有大量训练好的经典模型。逡逑(3)高度模块化的算法,扩展性和可重用性高。逡逑Caffe的核心概念是Layer,,每一个神经网络的模块都是一个Layer,Layer逡逑接收输入数据,同时经过内部计算产生输出数据,设计网络结构时,只需要通过逡逑配置文件把各个Layer拼接在一起构成完成的网络[4()]。如图2.4所示,展示了一逡逑
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:J613.2;TP181

【参考文献】

相关期刊论文 前8条

1 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期

2 曹辉;徐晨;赵晓;吴胜举;;说话人识别中的Mel特征频率倒谱系数[J];西北大学学报(自然科学版);2013年02期

3 侯珏;刘轶;郑方;蒋丹宁;秦勇;黄石磊;刘勇;;基于VP树结构的多层匹配算法在哼唱识别中的应用[J];清华大学学报(自然科学版);2009年S1期

4 曹文晓;刘轶;郑方;蒋丹宁;秦勇;;用于哼唱识别精确匹配的线性伸缩动态规划算法[J];清华大学学报(自然科学版);2009年S1期

5 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期

6 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期

7 覃光华,丁晶,陈彬兵;预防过拟合现象的人工神经网络训练策略及其应用[J];长江科学院院报;2002年03期

8 刘曙光;郑崇勋;刘明远;;前馈神经网络中的反向传播算法及其改进:进展与展望[J];计算机科学;1996年01期

相关硕士学位论文 前5条

1 王公友;基于内容的音频分析与场景识别[D];南京大学;2013年

2 王京辉;语音信号处理技术研究[D];山东大学;2008年

3 李晨;结合语音识别技术的音乐哼唱检索研究[D];西北大学;2008年

4 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年

5 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年



本文编号:2683660

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/mzqiyue/2683660.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户50033***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com