当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于MIDI哼唱检索算法的研究

发布时间:2018-07-17 01:36
【摘要】:随着多媒体技术的发展,以音频、视频和图像信息为主体的多媒体信息逐步取代了文本信息。基于文本标记的传统信息检索技术难以实现对多媒体信息的检索,如何有效、快速地检索多媒体信息,成为搜索引擎发展中迫切需要解决的问题。基于内容的音乐信息检索(Content Based Music Information Retrieval,CBMIR)是根据音乐的内在属性,,提取出音乐的特征向量(含节奏、旋律和音强等),构建音乐特征数据库;以乐谱、自然哼唱等形式提交检索项,将提取的特征向量与音乐特征数据库进行比较计算相似度,实现检索匹配。哼唱检索(QueryBy Humming, QBH)作为一种最直接、最自然的输入方式,自然成为基于内容检索技术的研究重点,并具有广泛的应用前景。 哼唱信号处理、音乐特征数据库构建和检索匹配算法是研究的重点。研究哼唱检索信号处理流程,介绍了信号预处理、参数提取及基于能量和音高变化的音符分割算法,针对哼唱信号,重点分析信号特征,并依此提出了改进的音符分割算法;分析MIDI音乐文件结构和MIDI旋律信息提取算法,构建了音高差,音长差,音符时长,音符间隔的旋律表示方式,能够有效克服音符连音和音符间隔的问题;介绍4种常用的检索匹配算法,并针对动态时间规整算法,重点从哼唱时出现的音符连音哼唱及音符间隔等两个方面进行改进,根据音符连音时的特点及音符间隔对检索匹配位置的作用,改进了动态时间规整算法。 在哼唱检索平台上测试了改进的音符分割算法和动态时间规整算法,实验结果表明改进算法的有效性。
[Abstract]:With the development of multimedia technology, multimedia information with audio, video and image information as the main body has gradually replaced text information. The traditional information retrieval technology based on text marking is difficult to realize the retrieval of multimedia information. How to retrieve multimedia information effectively and quickly has become an urgent problem in the development of search engine. Content based Music Information Retrieval (CBMIR) is to extract the music feature vectors (including rhythm, melody and strong tone etc.) according to the intrinsic attributes of music, to construct the music feature database, and to submit the retrieval items in the form of music score and natural humming. The extracted feature vector is compared with the music feature database and the similarity is calculated to achieve retrieval matching. As one of the most direct and natural input methods, QueryBy humming (QBH) has naturally become the focus of research on content-based retrieval technology and has wide application prospects. Hem signal processing, music feature database construction and retrieval matching algorithm are the focus of research. This paper studies the processing flow of humming retrieval signal, introduces signal preprocessing, parameter extraction and note segmentation algorithm based on energy and pitch changes, analyzes the characteristics of Hem signal, and puts forward an improved note segmentation algorithm. Based on the analysis of midi music file structure and midi melody information extraction algorithm, a melody representation method of pitch difference, note length difference and note interval is constructed, which can effectively overcome the problems of note concatenation and note spacing. This paper introduces four common retrieval and matching algorithms, and focuses on improving the dynamic time warping algorithm from two aspects: note concatenation and note spacing. According to the characteristics of note concatenation and the effect of note interval on searching matching position, the dynamic time warping algorithm is improved. The improved note segmentation algorithm and the dynamic time warping algorithm are tested on the humming retrieval platform. The experimental results show the effectiveness of the improved algorithm.
【学位授予单位】:江西师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期

2 薛振武;胡剑凌;;基于内容的音乐检索算法研究[J];电声技术;2009年03期

3 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期

4 冯国杰;王吉军;;基于分层次聚类的MIDI音乐主旋律提取方法[J];计算机工程与应用;2009年26期

5 李鹏;周明全;夏小亮;黎南杉;;改进的基音检测方法及在音乐检索中的应用[J];计算机工程与应用;2011年06期

6 马志欣;周利华;;哼唱检索中一种新颖有效的哼唱信息处理方法[J];计算机科学;2006年05期

7 赵芳;吴亚栋;宿继奎;;基于音轨特征量的多音轨MIDI主旋律抽取方法[J];计算机工程;2007年02期

8 罗凯;魏维;谢青松;;哼唱检索中改进的动态时间规整算法[J];计算机工程;2008年20期

9 王小凤;耿国华;刘晓宁;孙霞;;基于相对特征的音乐哼唱多句检索算法[J];计算机应用研究;2011年03期

10 蓝天;李扬;钟婷;秦志光;;旋律提取技术研究综述[J];计算机应用研究;2011年05期

相关硕士学位论文 前4条

1 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年

2 刘艳;哼唱音乐检索技术研究[D];哈尔滨理工大学;2008年

3 曹建红;基于哼唱的音乐检索技术研究[D];南京理工大学;2009年

4 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年



本文编号:2128446

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2128446.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e7bba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com