《清华大学》2009年硕士论文
本文关键词:基于混淆网络和辅助信息的语音识别技术研究,由笔耕文化传播整理发布。
《清华大学》 2009年
基于哼唱的音乐检索系统
李聪
【摘要】:随着大容量数字存储和数字音乐技术的迅速发展,如何进行基于内容的音乐检索成为迫切需要解决的问题。基于哼唱的音乐检索是基于内容的音乐检索方法之一。和传统的检索方式不同,基于哼唱的音乐检索系统不需要耗费大量的人力物力对歌曲信息进行描述和分类,它允许用户以一种直观、方便、快捷的方法检索到所需的音乐数据信息。 本文系统研究了一个基于哼唱的音乐检索系统,允许用户通过多种形式的哼唱作为检索输入,对MIDI格式的歌曲库进行检索,之后以前N列表的形式将用户所需的歌曲返回给用户。本文主要贡献包括两方面的工作:1)提出一种音符序列的旋律直方图特征,将不定长的音符序列以定长的12维旋律直方图特征来表达,从而进一步将高维数据索引的BVI(Bit Vector Indexing)算法引入到哼唱检索系统中,利用旋律直方图特征建立BVI索引,有效快速的过滤歌曲片段候选集。2)重点研究了旋律匹配的RA(Recursive Alignment)算法,并对其提出了三个方面的改进:改变距离度量,增加音符序列和基音轮廓不匹配端点惩罚项和音符序列偏移匹配,从而有效提高了检索准确度。 本文实现的哼唱检索系统在MIREX2008的哼唱检索评测任务所采用的哼唱检索数据库上进行实验,得到了93.7%的排序倒数平均值。通过BVI索引和改进的RA匹配算法的详细分析和对比实验,证明本文的两方面主要工作在过滤歌曲片段候选集和提高哼唱检索系统整体检索准确度方面起到的重要作用。
【关键词】:
【学位授予单位】:清华大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.3
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【引证文献】
中国硕士学位论文全文数据库 前2条
1 杨波;基于内容的多音音乐检索系统设计[D];武汉理工大学;2012年
2 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
【同被引文献】
中国期刊全文数据库 前10条
1 柏静,韦岗;一种基于线性预测与自相关函数法的语音基音周期检测新算法[J];电声技术;2005年08期
2 张晶;范明;冯文全;董金明;;基于MFCC参数的说话人特征提取算法的改进[J];电声技术;2009年09期
3 张士峰;混合正态分布参数极大似然估计的EM算法[J];飞行器测控学报;2004年04期
4 李鹏;周明全;夏小亮;黎南杉;;改进的基音检测方法及在音乐检索中的应用[J];计算机工程与应用;2011年06期
5 范新伟,申瑞民,杜彦蕊;用LPC及DTW进行语音模式比较的设计与实现[J];计算机工程;2004年01期
6 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期
7 张永亮;张先庭;鲁宇明;;基于FMFCC和HMM的说话人识别[J];计算机仿真;2010年05期
8 王昉;;音乐检索现状及发展趋势研究[J];科技广场;2008年03期
9 黄顺珍,方棣棠;基于拼音模型的声学层识别的研究[J];中文信息学报;2002年03期
10 张红亮;;语音检索系统研究[J];情报探索;2009年08期
中国博士学位论文全文数据库 前5条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
3 王小凤;基于内容的音乐检索关键技术研究[D];西北大学;2008年
4 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年
5 陈刚;基于内容的相关反馈式音乐检索方法研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴长君;基于旋律的音乐检索系统设计与实现[D];北京邮电大学;2011年
2 陆冬;语音到语音的检索系统研究[D];哈尔滨工程大学;2011年
3 刘盈;大词表连续语音识别系统的研究与实现[D];清华大学;2005年
4 郭丽惠;基于内容的哼唱式音乐检索研究[D];华东师范大学;2008年
5 黄磊;基于内容的MP3音乐检索研究和实现[D];厦门大学;2008年
6 段志尧;多音音乐音高估计研究[D];清华大学;2008年
7 张新彩;基于内容的音乐检索技术研究与实现[D];西北大学;2009年
8 孔旭;基于声谱图的音乐检索[D];复旦大学;2009年
9 曹建红;基于哼唱的音乐检索技术研究[D];南京理工大学;2009年
10 孙国成;基于内容的音频检索研究[D];华中科技大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 冯晓伟;;不知歌手歌名 哼唱几声就找到[J];电脑爱好者(普及版);2010年12期
2 孙挺;耿国华;周明全;王小凤;;基于音乐旋律轮廓的特征提取算法[J];计算机工程与应用;2008年18期
3 徐霁;袁旭海;王让定;;一个音乐检索系统的研究与实现[J];宁波大学学报(理工版);2007年03期
4 张燕;钱博;李燕萍;;元音检测和最值点符号特征匹配的音乐检索[J];计算机工程与应用;2009年36期
5 金毅,黄敏;基于旋律的音乐检索[J];情报学报;2003年03期
6 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期
7 徐开阔;唐常杰;段磊;魏大刚;钟义啸;乔少杰;;正态分布下基于隐Markov模型的多声道MIDI音乐检索[J];四川大学学报(自然科学版);2006年03期
8 秦静;王醒策;周明全;刘新宇;;基于遗传算法的旋律匹配模型研究[J];哈尔滨工程大学学报;2010年02期
9 韩圣龙;;音乐旋律表示及匹配方法浅议[J];中国图书馆学报;2007年06期
10 焦玉英,周华敏;基于音频内容的交互渐进式音乐检索系统的设计[J];情报科学;2004年12期
中国重要会议论文全文数据库 前10条
1 许洁萍;袁斌;刘怡;;音乐检索系统中用户哼唱旋律错误的研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
2 李静;林鸿飞;;基于用户情感标签的音乐检索算法[A];第六届全国信息检索学术会议论文集[C];2010年
3 王小凤;周明全;耿国华;郭红波;;一种基于字符距离的特征字符串近似匹配算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
4 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年
6 周瑾莹;;广播电台音乐信息检索中的关键技术研究[A];中国新闻技术工作者联合会五届二次理事会暨学术年会论文集(上篇)[C];2010年
7 徐英进;王愈;蔡锐;蔡莲红;;一种基于“乐纹”的海量音乐检索系统[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
8 朱幻洲;;五卅情缘[A];老兵话当年(第十辑)[C];2006年
9 孟宪巍;徐蔚然;潘兴德;郭军;;基于内容的音乐信息检索技术综述[A];2008年声频工程学术交流年会论文集[C];2008年
10 王小凤;耿国华;孙霞;张翔;;一个以句为单位的音乐哼唱检索算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
中国重要报纸全文数据库 前10条
1 陈佼 资深互联网分析人士;[N];电脑报;2010年
2 本报记者 汪建根;[N];中国文化报;2011年
3 柯文;[N];人民日报;2006年
4 张友田;[N];唐山劳动日报;2007年
5 闫婷;[N];计算机世界;2007年
6 焦照峰;[N];中国教师报;2003年
7 英子;[N];医药经济报;2001年
8 蓝天;[N];江苏科技报;2003年
9 张依秋;[N];保健时报;2003年
10 徐怀谦;[N];人民日报;2003年
中国博士学位论文全文数据库 前10条
1 陈刚;基于内容的相关反馈式音乐检索方法研究[D];华中科技大学;2010年
2 王峰;美尔音级轮廓特征在音乐和弦识别算法中的应用研究[D];太原理工大学;2010年
3 杨滨;智能计算及应用研究[D];吉林大学;2010年
4 韩东峰;图像分类识别中特征及模型的若干问题研究[D];吉林大学;2008年
5 庄连生;复杂光照条件下人脸识别关键算法研究[D];中国科学技术大学;2006年
6 刘伟;图像检索中若干问题的研究[D];浙江大学;2007年
7 杨铁滨;基于机器视觉的陶瓷球表面缺陷自动检测技术研究[D];哈尔滨工业大学;2007年
8 戴天虹;基于计算机视觉的木质板材颜色分类方法的研究[D];东北林业大学;2008年
9 许治华;抗几何攻击的图像拷贝检测算法研究[D];华中科技大学;2010年
10 李卓;图像信息隐藏与隐写分析算法的研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李聪;基于哼唱的音乐检索系统[D];清华大学;2009年
2 李扬;基于哼唱的音乐检索系统的研究与实现[D];电子科技大学;2012年
3 鲁帆;基于哼唱的音乐检索系统[D];西安建筑科技大学;2011年
4 支林;基于哼唱的歌曲检索系统的研究与设计[D];电子科技大学;2011年
5 李江涛;基于旋律特征提取的哼唱式音乐检索[D];哈尔滨工业大学;2009年
6 罗如海;用改进人工蜂群算法优化基于内容的哼唱音乐检索系统[D];哈尔滨工业大学;2010年
7 苏启院;基于内容的音乐检索关键技术研究[D];华南理工大学;2011年
8 曲毅;哼唱旋律辨识与检索技术研究[D];大连海事大学;2012年
9 杨波;基于内容的多音音乐检索系统设计[D];武汉理工大学;2012年
10 吴长君;基于旋律的音乐检索系统设计与实现[D];北京邮电大学;2011年
本文关键词:基于混淆网络和辅助信息的语音识别技术研究,由笔耕文化传播整理发布。
,本文编号:116057
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/116057.html