基于哈希的音频指纹提取算法的研究

发布时间：2017-11-19 09:06

本文关键词：基于哈希的音频指纹提取算法的研究

【摘要】：近年来,随着多媒体技术的不断发展和互联网的普及,各式各样的多媒体应用也层出不穷,也越来越深入人们的日常生活。特别是音乐识别类应用,人们通常希望能识别出未知音频的详细信息,例如歌曲的名字,歌曲的演唱者、作曲人等。由于网络环境的包容性和复杂性,音频文件通常会经过压缩、编辑等操作,导致音频文件的失真或不完整,另外,在音频的传输过程中还可能产生噪音,如何在各种环境下鲁棒而又高效的识别大量的音频文件成了音频指纹技术中的一大难点。音频指纹技术通过提取音频信号的特征对音频进行识别。音频指纹是数字音频信号经过哈希函数压缩后的一种紧致表现,能唯一的标识音频信号。本文对哈希函数的发展以及在音频指纹领域的应用进行了总结,阐述了音频哈希函数从传统哈希函数到感知哈希函数的进化历程。感知哈希函数继承了传统哈希函数的优点,通过模拟人耳听觉特性,使得生成的指纹具有抗内容保持操作、对内容篡改操作的敏感性。梅尔域就是一种模拟人耳听觉系统的数据模型。本文提出了一种基于梅尔滤波器的哈希构造方法,指纹具有感知特性,并且加入了动态特征系数以及平均能量值,提高了指纹的识别性和鲁棒性。在指纹的后处理当中应用了哈尔小波变换,有效的减小了音频指纹的体积。针对新提出的指纹算法,本文还提出了一种新的双因子匹配算法,将音频指纹从方向和距离两个维度来比较相似度,提高匹配的效率及准确率。我们对提出的新算法进行了实验。实验表明,本文提出的算法提取出的指纹具有较高的精度、较小的体积,能有效的减小指纹数据库的空间,匹配过程中的双因子系数能提高指纹匹配率,适用于音频文件退化或者有一定噪音背景的场景。
【学位授予单位】：湖南师范大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：TN912.34
，

本文编号：1202998

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1202998.html

上一篇：固态振动陀螺建模及误差分析
下一篇：希达P1.875 LED屏幕在新闻直播中的应用探索

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|