基于哼唱的MIDI音频检索算法研究
本文选题:哼唱检索 + MIDI ; 参考:《山东科技大学》2017年硕士论文
【摘要】:随着音乐数据库爆炸式的增长,传统的基于文本的音频检索给用户带来极大的不便。基于哼唱的MIDI音乐检索是基于内容的音乐检索方式,它允许用户不需要歌词而只需哼唱旋律就可以检索到自己需要的歌曲。本文的目标是构建完整的基于哼唱的MIDI音频检索算法并检验其可行性。本文的主要研究内容如下:1.音频特征提取。分析了音频信号的时域、频域和倒谱特征,并介绍了几种基本的旋律轮廓的表达,阐述了音频信号的特征提取方法。2.基于HMM的哼唱检索算法。建立了以音符为基础的HMM模型,避免了音符切分。对音调进行转换,将音调转换后的音高序列作为旋律的音高特征,从而克服了因哼唱者哼唱习惯和音域差别导致的差异。用500个哼唱片段的测试集测试算法的性能,达到了 TOP3为78%的识别率。3.基于深度学习的哼唱检索算法。采用3层DBN网络结构得到每首歌曲的关键特征,保证旋律数据能精确描述歌曲旋律,解决了旋律特征不稳定的情况。并采用了基于聚类的方法实现旋律特征的近邻检索。构建了 200首MIDI格式的音乐库,用42首wav格式的哼唱查询文件验证算法的性能,达到了 TOP3为81.0%的识别率。同时引入基于DBN的哼唱检索算法与基于LSH的哼唱检索算法的对比实验,证明了基于DBN的检索算法的优良性能。上述两个算法的核心部分都包括旋律特征提取和旋律特征匹配,这也是各个检索算法着重研究的部分。MIDI音乐数据库的旋律特征提取和哼唱旋律特征提取相关技术在各个算法中都有着重研究。
[Abstract]:With the explosive growth of music database, traditional text-based audio retrieval brings great inconvenience to users. Midi music retrieval based on humming is a content-based music retrieval method, which allows users to retrieve the songs they need without the lyrics but only by humming the melody. The goal of this paper is to construct a complete midi audio retrieval algorithm based on humming and to test its feasibility. The main contents of this paper are as follows: 1. Audio feature extraction. In this paper, the time domain, frequency domain and cepstrum characteristics of audio signal are analyzed, and the expression of several basic melodic contours is introduced, and the feature extraction method of audio signal. Hem retrieval algorithm based on hmm. The hmm model based on notes is established to avoid the segmentation of notes. In order to overcome the differences caused by humming habits and range differences, the pitch sequence after tone conversion is regarded as the pitch feature of the melody. The performance of the algorithm is tested with 500 humming test sets, and the recognition rate of TOP3 is 78%. 3. Hem retrieval algorithm based on deep learning. The key features of each song are obtained by using a three-layer DBN network structure, which ensures that the melody data can accurately describe the melody of the song, and solves the unstable situation of the melody characteristic. The nearest neighbor retrieval of melody feature is realized by clustering method. 200 music libraries in midi format are constructed and 42 wav format humming query files are used to verify the performance of the algorithm. The recognition rate of Top3 is 81.0%. At the same time, the comparison experiment between the humming retrieval algorithm based on DBN and the Hem retrieval algorithm based on LSH proves the excellent performance of the retrieval algorithm based on DBN. The core parts of the above two algorithms include melody feature extraction and melody feature matching. This is also the part of each retrieval algorithm. The melody feature extraction and humming melody feature extraction of midi music database are studied in each algorithm.
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3;TP391.3
【参考文献】
相关期刊论文 前10条
1 肖艳;王虎;;一种基于哼唱的小规模MIDI音乐检索系统及实现[J];中国新通信;2017年03期
2 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
3 郭敏;张卫强;刘加;;一种基于帧-音符方式的哼唱检索算法[J];清华大学学报(自然科学版);2011年04期
4 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期
5 袁里驰;;基于改进的隐马尔科夫模型的语音识别方法[J];中南大学学报(自然科学版);2008年06期
6 罗凯;魏维;谢青松;;哼唱检索中改进的动态时间规整算法[J];计算机工程;2008年20期
7 赵芳;吴亚栋;宿继奎;;基于音轨特征量的多音轨MIDI主旋律抽取方法[J];计算机工程;2007年02期
8 徐开阔;唐常杰;段磊;魏大刚;钟义啸;乔少杰;;正态分布下基于隐Markov模型的多声道MIDI音乐检索[J];四川大学学报(自然科学版);2006年03期
9 续鸿飞;肖明;;音频检索综述[J];晋图学刊;2005年06期
10 李雪莹,刘宝旭,许榕生;字符串匹配技术研究[J];计算机工程;2004年22期
相关硕士学位论文 前7条
1 孙洁;基于哼唱的MIDI音乐检索系统的研究[D];西安建筑科技大学;2013年
2 曹建红;基于哼唱的音乐检索技术研究[D];南京理工大学;2009年
3 沙晓艳;HMM模型在哼唱检索中的应用[D];西北大学;2008年
4 宋星华;基于哼唱的音乐检索[D];南京理工大学;2008年
5 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年
6 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年
7 王薇;基于内容的音频检索特征提取技术研究[D];上海交通大学;2008年
,本文编号:2082456
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2082456.html