歌曲中相似片段的检测及其应用
本文关键词: 歌曲借用 递归图 状态空间嵌入 相似片段检测 相似度计算 出处:《复旦大学》2014年硕士论文 论文类型:学位论文
【摘要】:随着互联网的普及,几乎所有的音乐作品都对应的其数字化版本,且作品数量正飞速增长。追随着这种潮流,各大互联网服务供应商都推出了自己的在线歌曲库,内含海量歌曲作品。因此,怎样对大量的歌曲进行分类整理、信息提取,以便提供更好的检索、查询、欣赏等服务,成为近些年的热门研究课题。早期的歌曲库管理和歌曲检索功能依赖大量的人工标注,比如手工录入每首歌的年代、作者、流派等信息。这样的方法虽然可以保证信息标注的准确度,但成本非常大,且并不能满足很多常用的需求。由此,大量基于信号级别的歌曲信息处理相关的研究课题便大量涌现,如翻唱检索、哼唱检索、歌曲摘要提取、音频片段认证等。在所有这些研究课题中,歌曲相似片段检测与定位是一个非常重要的基础技术和子课题。音乐作品中相似片段是十分常见的:例如同一首歌曲中的副歌部分通常有着一样的旋律;又如同一首歌曲被多个歌手分别演唱所产生的不同版本。这里的相似可以是指某一特定方面的相似,如旋律、节奏、音色等。在很多情况下用人耳可以轻易辨别出相似的歌曲片段,然而对于计算机而言这个任务却很困难。由于直接基于歌曲信号提出的特征本身包含着大量的噪音,因此目前现有的相似片段检测算法有着诸多问题:首先,所有的算法准确度普遍不高;其次,每个算法都只能大致检测出两个给定片段的相似程度,但却不能精确定位;另外,现有算法无法检测出两段较短的相似片段。综上,目前的相似片段检测算法还有相当大的改进空间。为解决和改进上述提到的相关算法存在的问题,本文提出了一种新的相似片段检测算法。该算法吸收了现有的音乐信号处理研究中所用到的多种技术,如相似度矩阵、递归图、状态空间嵌入等,并在此基础上引入了数种创新技术,如局部阈值策略、基于递归图的相似片段提取技术等。本文提出的算法解决了先前类似算法中的多个缺陷:无法较准确定位相似片段位置;无法检测较短的相似片段。在此基础上,该算法还通过采用改进的阈值策略来提高相似片段检测的准确度。为检测该算法的有效性,本文将该算法应用于三个具体的系统中:改进的翻唱检索系统;基于该相似片段检测算法的歌曲摘要提取系统;歌曲借用检测系统。其中,歌曲借用检测是一个尚未有相关研究的课题。由于本文提出的算法可以检测歌曲中较短的相似片段,因此该课题得以第一次被进行尝试性的研究。针对上述三个系统的实验证明了本文所提出算法的有效性。
[Abstract]:With the popularity of the Internet, almost all music works correspond to their digital versions, and the number of works is growing rapidly. Following this trend, various Internet service providers have launched their own online song library. Therefore, how to sort out a large number of songs and extract information in order to provide better retrieval, inquiry, appreciation and other services, Early song library management and song retrieval functions depended on a large number of manual tagging, such as manual entry of each song, the author, This method can guarantee the accuracy of information tagging, but it is very costly and does not meet a lot of common needs. A large number of research topics related to song information processing based on signal level have emerged in large numbers, such as rap retrieval, humming retrieval, song abstract extraction, audio segment authentication and so on. Song similarity detection and location is a very important basic technology and sub-topic. Similar fragments are very common in musical works: for example, the chorus part of the same song usually has the same melody; It's like a different version of a song being sung by multiple singers. The similarity here can refer to the similarity of a particular aspect, such as melody, rhythm, Timbre and so on. In many cases, similar song fragments can be easily identified with the human ear, but this task is difficult for a computer. Because the features that are directly based on the song signal contain a lot of noise, Therefore, the existing similar segment detection algorithms have many problems: first, the accuracy of all algorithms is generally not high; secondly, each algorithm can only roughly detect the similarity of two given fragments, but can not accurately locate. The existing algorithms can not detect two short similar fragments. In summary, there is still considerable room for improvement of the current similar segment detection algorithms. In this paper, a new similar segment detection algorithm is proposed, which absorbs many techniques used in the research of music signal processing, such as similarity matrix, recursive graph, state space embedding, etc. On this basis, several innovative techniques are introduced, such as local threshold strategy, similar segment extraction based on recursive graph and so on. The algorithm proposed in this paper solves many defects in the previous similar algorithms: the location of similar segments cannot be located accurately; Short similar fragments can not be detected. On this basis, the improved threshold strategy is adopted to improve the accuracy of the detection of similar fragments. This paper applies the algorithm to three specific systems: an improved copy retrieval system; a song digest extraction system based on the similar segment detection algorithm; a song borrowing detection system. Song borrowing detection is a subject that has not been studied yet. Because the algorithm proposed in this paper can detect short similar fragments in songs, Therefore, this subject can be studied for the first time. Experiments on the above three systems have proved the effectiveness of the proposed algorithm.
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.2
【相似文献】
相关期刊论文 前10条
1 郑炜冬;;试卷相似度自动评估技术的研究[J];智能计算机与应用;2011年06期
2 赵涛;肖建;;二型模糊相似度及其应用[J];计算机工程与应用;2013年08期
3 徐志明;李栋;刘挺;李生;王刚;袁树仑;;微博用户的相似性度量及其应用[J];计算机学报;2014年01期
4 李桂林,陈晓云;关于聚类分析中相似度的讨论[J];计算机工程与应用;2004年31期
5 秦玉平;杨兴凯;;基于案例推理的区间属性相似度研究[J];辽宁师范大学学报(自然科学版);2006年04期
6 蒋鹏;;基于本体的应急案例相似度算法研究[J];南昌高专学报;2009年03期
7 何亚;;词语相似度算法的分析与改进[J];硅谷;2011年24期
8 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期
9 焦鹏;唐见兵;查亚兵;;仿真可信度评估中相似度方法的改进及其应用[J];系统仿真学报;2007年12期
10 姜毅;乐庆玲;;一种基于兴趣相似度的学习社区算法[J];电脑知识与技术(学术交流);2007年16期
相关会议论文 前10条
1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陆劲挺;路强;刘晓平;;对比相似度计算方法及其在功能树扩展中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
5 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
6 洪文学;王金甲;常凤香;宋佳霖;刘文远;王立强;;基于图形特征增强的相似度分类器的研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
7 雷庆;吴扬扬;;一种基于语义信息计算XML文档相似度的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年
9 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
10 王健;刘衍珩;焦玉;;VANETs信任传播建模[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
相关重要报纸文章 前1条
1 王伽 卫江;出入境证件照片应及时更换[N];中国国门时报;2008年
相关博士学位论文 前10条
1 操震洲;矢量数据动态多尺度网络传输研究[D];南京大学;2015年
2 张明西;信息网络中的相似度搜索问题研究[D];复旦大学;2013年
3 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年
4 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年
5 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年
6 马海平;基于概率生成模型的相似度建模技术研究及应用[D];中国科学技术大学;2013年
7 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
8 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年
9 姜雅文;复杂网络社区发现若干问题研究[D];北京交通大学;2014年
10 张磊;个性化推荐和搜索中若干关键问题的研究[D];北京邮电大学;2009年
相关硕士学位论文 前10条
1 杨巧;基于改进相似度的社会网络链接预测研究[D];华南理工大学;2015年
2 张宁;某于《知网》的词语相似度优化算法[D];昆明理工大学;2015年
3 沈迤淳;歌曲中相似片段的检测及其应用[D];复旦大学;2014年
4 梁霄;社交网络中的社区聚集研究[D];上海交通大学;2015年
5 王魁;在线社交中基于微博的好友推荐系统设计与实现[D];电子科技大学;2015年
6 洪耀停;基于共同作者图的合作者推荐系统[D];浙江大学;2015年
7 褚立超;基于相似度评分模型的人员识别方法研究[D];广西大学;2015年
8 谭夏;基于软集相似度理论的医学诊断系统[D];西北师范大学;2014年
9 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
10 李磊;虚拟教学实验方案相似度的分析和度量[D];华中科技大学;2009年
,本文编号:1498330
本文链接:https://www.wllwen.com/kejilunwen/wltx/1498330.html