当前位置:主页 > 科技论文 > 网络通信论文 >

基于E2LSH的音乐哼唱检索系统的研究

发布时间:2018-08-01 09:57
【摘要】:在基于内容的检索领域中,音频检索是新发展起来的研究热点。音乐哼唱检索是基于内容的音频检索的一个分支,它提供了一种新颖、方便的音乐检索方法,当人们遗忘了歌曲的歌名等信息时,用户可以通过哼唱一段旋律的方式,在大型歌曲数据库中快速寻找到目标歌曲,这种检索方式给用户带来了简单、直观、方便的音乐检索体验。本文分析了当今基于哼唱的音乐检索系统中的一些技术,对旋律特征表示方法、旋律特征提取算法、旋律匹配算法进行了讨论和研究。现今的哼唱检索系统大都忽略了检索速度的问题,本文针对这个问题,将基于精确欧氏距离位置敏感哈希的相似性检索技术应用到哼唱检索中,构建一个快速的音乐哼唱检索系统。本文主要做了以下几个方面工作:1.对哼唱检索系统基础进行了分析。在了解哼唱检索系统结构的基础上,分别研究了旋律特征表示方法以及相关语音信号处理技术,研究了使用MIDI文件建立旋律模板库,研究了旋律特征的提取技术,包括基音周期预估、平滑处理和音符切分,其中,对比了几种基音周期预估算法,YIN的性能较好,然后对旋律匹配过程中音高偏移问题和音长伸缩问题进行分析讨论。2.对旋律匹配技术进行研究。本文对比了线性伸缩(LS),动态时间规整(DTW)和土堆移动距离(EMD)三种旋律匹配算法的性能,针对旋律匹配,对DTW算法进行了动态阈值偏移约束的改进,形成了检索速度较快的改进型DTW(IDTW)。综合EMD与IDTW各自的优点,本文提出了一种旋律匹配算法EMD-IDTW,该方法匹配准确率较高且检索速度较快。3.针对现今哼唱检索系统检索速度慢、需要穷举匹配的问题,本文研究了基于精确欧氏位置敏感哈希(E2LSH)的相似性快速检索技术,对E2LSH及其哈希函数进行了理论分析,将E2LSH检索技术应用到哼唱检索系统中,建立了基于pitch向量的E2LSH索引结构,利用该索引结构进行第一层检索,加快了系统检索速度。本文结合EMD-IDTW匹配算法,提出了Pitch-E2LSH+EMD-IDTW旋律匹配方法。最后本文构建了基于E2LSH的音乐哼唱检索系统,该系统在保证检索准确率的情况下,大大提高了检索速度。
[Abstract]:In the field of content-based retrieval, audio retrieval is a new research hotspot. Music humming retrieval is a branch of content-based audio retrieval, which provides a novel and convenient method of music retrieval. When people forget the song title and other information, the user can sing a melody by humming. The target songs are quickly found in the large song database, which brings users a simple, intuitive and convenient music retrieval experience. This paper analyzes some techniques in the music retrieval system based on humming, and discusses and studies the melody feature representation method, melody feature extraction algorithm and melody matching algorithm. In this paper, the similarity retrieval technology based on the accurate Euclidean distance position sensitive hash is applied to the humming retrieval. Build a fast music humming retrieval system. This article mainly does the following several aspects of work: 1. The basis of humming retrieval system is analyzed. On the basis of understanding the structure of the humming retrieval system, this paper studies the melody feature representation method and the related speech signal processing technology, studies the establishment of melody template library using MIDI file, and studies the melody feature extraction technology. It includes pitch period prediction, smoothing processing and note segmentation. Among them, the performance of several pitch prediction algorithms called yen is compared, and then the pitch offset and pitch scaling in melodic matching are analyzed and discussed. The melody matching technique is studied. This paper compares the performance of three melodic matching algorithms of linear telescopic (LS), (dynamic time warping (DTW) and moving distance (EMD). Aiming at melody matching, the dynamic threshold offset constraint of DTW algorithm is improved to form an improved DTW (IDTW). With fast retrieval speed. Based on the advantages of EMD and IDTW, a melody matching algorithm, EMD-IDTW, is proposed in this paper, which has high matching accuracy and fast retrieval speed. Aiming at the problem of slow retrieval speed and exhaustive matching in humming retrieval system, a fast similarity retrieval technique based on accurate Euclidean position sensitive hashing (E2LSH) is studied in this paper, and E2LSH and its hash functions are analyzed theoretically. The E2LSH retrieval technology is applied to the humming retrieval system, and the E2LSH index structure based on pitch vector is established. The first layer retrieval is carried out by using the E2LSH index structure, which speeds up the retrieval speed of the system. Combining with EMD-IDTW matching algorithm, this paper proposes a Pitch-E2LSH EMD-IDTW melody matching method. Finally, this paper constructs a music humming retrieval system based on E2LSH, which can greatly improve the retrieval speed under the condition of guaranteeing the retrieval accuracy.
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3;TP391.3

【相似文献】

相关期刊论文 前10条

1 黄碧玉;;多国文字情报微机检索系统[J];微型机与应用;1987年05期

2 朱鸣学;赵侠;;《红楼梦》电脑检索系统在联邦德国[J];深圳大学学报;1988年Z1期

3 佚名;;论档案文献基本检索系统及其相互关系——档案、图书、情报学互鉴研究之二[J];档案管理;1988年06期

4 唐焕文,姜冶,郭建,苏秀荣,高桂清;油田历史统计资料查询检索系统[J];大连理工大学学报;1989年05期

5 冯新宁,周中一,方宁德,王让定,冯百明;电子琴输入微机记谱与检索系统[J];兰州大学学报;1992年S1期

6 周山;;一个综合实用的情报处理和检索系统[J];交通与计算机;1992年04期

7 汪红秋;;单汉字检索系统查全率查准率的保障[J];情报学刊;1993年06期

8 朱猛;医学图书微机编目与检索系统[J];计算机系统应用;1994年03期

9 杜元洪,黄正东,茹家钜;《广后医学》文献微机检索系统[J];解放军医学情报;1994年04期

10 田波;如何建立网络信息查找检索系统[J];计算机系统应用;1997年10期

相关会议论文 前10条

1 杨光复;;论年鉴的检索系统和信息开发[A];创新与发展——云南省年鉴论文选(续集)[C];2006年

2 许洁萍;袁斌;刘怡;;音乐检索系统中用户哼唱旋律错误的研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

3 张刚;孙健;丁国栋;米嘉;王斌;;海量数据的索引与检索系统[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年

4 顾寄南;陈晓燕;;检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(下册)[C];2008年

5 徐英进;王愈;蔡锐;蔡莲红;;一种基于“乐纹”的海量音乐检索系统[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

6 刘超彪;宋鸿陟;司国东;傅熠;;应用于移动学习的树木检索系统[A];第八届和谐人机环境联合学术会议(HHME2012)论文集CHCI[C];2012年

7 王宁;范志新;胡运发;;虚拟图书馆检索系统的设计与实现[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年

8 高鹏;梁家恩;王晓瑞;徐波;;一个面向海量视音频应用的快速关键音检索系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

9 穆飞;李维佳;薛巍;舒继武;;一种分布式信息检索系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年

10 张浩;黄厚宽;;基于OAI协议的统一检索系统研究与实现[A];首届中国CAE工程分析技术年会暨2005全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2005年

相关重要报纸文章 前10条

1 王津东 李会霞;南京市江宁区 法律法规检索系统推进工作信息化[N];中国社会报;2008年

2 杨申武;工程建设标准强制性条文检索系统即将开通运行[N];中国建设报;2012年

3 本报记者 汪建根;想不起歌名,你就哼一声[N];中国文化报;2011年

4 葛涛;人文社科期刊怎样进入国际权威领域[N];中华读书报;2003年

5 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年

6 柯文;找音乐?会哼几句就行[N];人民日报;2006年

7 本报记者 侯闯;让企业不再“眼花”[N];计算机世界;2003年

8 ;让法治细胞在网络上繁衍[N];人民法院报;2002年

9 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;实验与实用系统[N];计算机世界;2003年

10 枫丹;企业搜索引擎 安全性能大盘点[N];中国计算机报;2005年

相关博士学位论文 前3条

1 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年

2 张毅波;中文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年

3 王镪;基于内容的海量音乐检索技术研究[D];北京邮电大学;2013年



本文编号:2157205

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2157205.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aeea0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com