基于Shazam算法的音频样例检索技术研究
【图文】:
l——1,2, ,L滤波器频率特性为:( ), ( ) ( )( ) ( )( ), c( ) ( )( ) ( )( )ik o lo l k c lc l o lh l kl k h lh l c lW k (2.6(4)对滤波器输出取对数,再进行离散余弦变换(Discrete Cosine TransformDCT),得到 MFCC:1( ) lg ( ) cos[ ( 0.5) ]LMFCClC n Y l l n L (2.7式中,n——上述得到的 MFCC 作为静态特征,进行一阶与二阶差分,可达到相应的动态特征。
图 2.3 相邻 Mel 滤波器频率的关系2.2 音频信息检索的评价音频信息检索的评价是音频信息检索领域中的一项重要工作,通过比较各种检索技术的优劣,,对改进现有检索系统的性能以及开发新的应用领域和研究方向等方面都发挥着不可替代的作用[40]。信息检索中通常采用准确率、召回率、综合性能 F 测度,还有检索时间等指标衡量。本文的音频检索系统采用下面几个性能指标进行评价:(1)准确率(Precision Rate, 也称为查准率)是指检索出相关信息的文档和实际检索出的文档的比值。本文中是指检索出正确的音频个数和实际检索出的总的音频个数的比值,其公式定义如下:检索出正确的音频个数
【学位授予单位】:重庆邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.3;TN912.3
【参考文献】
相关期刊论文 前5条
1 高晓芳;罗森林;吕英;罗志军;潘丽敏;;双哈希索引的高精度大规模音频样例检索[J];声学学报;2015年06期
2 孟建华;陈宁;;基于Gammachirp耳蜗能量谱特征提取的音频指纹算法[J];华东理工大学学报(自然科学版);2015年05期
3 杨鹏;谢磊;张艳宁;;低资源语言的无监督语音关键词检测技术综述[J];中国图象图形学报;2015年02期
4 丁明亮;陈隽;;自闭症患儿言语康复训练系统的研究[J];生命科学仪器;2013年Z1期
5 吴大刚,肖荣荣;C/S结构与B/S结构的信息系统比较分析[J];情报科学;2003年03期
相关博士学位论文 前2条
1 张雪源;面向音频检索的音频特征分析方法研究[D];华南理工大学;2015年
2 王镪;基于内容的海量音乐检索技术研究[D];北京邮电大学;2013年
相关硕士学位论文 前7条
1 吴娟;基于数字指纹的音乐哼唱检索系统的设计与实现[D];湖南师范大学;2015年
2 赵娟;基于内容的海量音频智能检索与重复性检测[D];太原理工大学;2015年
3 曹清然;电台音乐检索系统设计与实现[D];电子科技大学;2015年
4 郭永帅;基于音频指纹和版本识别的音乐检索技术研究[D];哈尔滨工业大学;2014年
5 陈隽;基于自闭症患儿语言康复训练的语音识别系统的研究[D];重庆理工大学;2013年
6 张磊;音频样例检索技术研究[D];哈尔滨工程大学;2010年
7 王明娟;基于FPGA语音识别系统设计与实现[D];广西师范大学;2009年
本文编号:2594323
本文链接:https://www.wllwen.com/kejilunwen/wltx/2594323.html