语音感知哈希及其在密文语音检索中的应用研究
发布时间:2017-07-06 07:19
本文关键词:语音感知哈希及其在密文语音检索中的应用研究
【摘要】:近年来,互联网技术、多媒体处理技术发展迅猛,多媒体数据在信息交流、信息存储等方面中发挥了越来越重要的作用。而语音作为最便捷的多媒体信息,在人类交流、沟通中的作用尤为重要。随着计算机存储技术的进步,特别是云存储技术的发展,语音数据储量也飞速增加。网络平台拥有庞大的用户量,在其中,语音信息用途多样,使用也很频繁,而如何在保证隐私数据安全的前提下更高效地处理大规模语音信息成为急需解决的问题。本文研究了适合大规模语音处理的语音感知哈希技术及其在密文语音检索中的应用,主要研究工作如下:(1)现有的语音感知哈希算法所提取的摘要序列,没有区分权重,导致大规模应用时效率较低。鉴于此,本文提出一种基于时域、频域趋势变化的语音感知哈希方案。该方案将语音分为时域和频域两部分提取特征,时域特征选取语音的短时能量变化情况,频域特征选取语音的Bark域能量变化情况。使用该算法生成的感知哈希序列,匹配时先匹配时域感知哈希序列,再匹配频域感知哈希序列,若两组匹配结果都成功,则判定匹配成功,若时域感知哈希匹配失败,则不匹配频域感知哈希,直接判定匹配失败。这样,在应用于大规模语音处理时,可大大提高感知哈希的匹配速度。实验仿真结果表明,该算法在效率提升的情况下,依然具有很好的区分性,对常用的内容保持操作有很强的鲁棒性。(2)语音中不乏语音订单、法庭证据、军事机密等重要的信息,如果将这些重要语音信息不加保护的上传云端,很容易造成信息泄露。而前端加密是保障云环境中数据安全的有效方法。加密数据规模的不断增大,给快速、准确的检索带来了很大的困难。本文为解决这一难题,利用语音感知哈希算法,设计了一种密文语音检索方案,采用特定的加密算法对语音进行加密,再将语音生成的感知哈希序列作为数字水印嵌入到加密后的语音中。在检索时无需解密,只需进行感知哈希序列匹配,就可以实现在不解密、不下载的情况下,对云端的大规模密文语音进行快速、准确检索的目的。实验结果显示,该方案获得了很好的查全率和查准率。
【关键词】:感知哈希 数字水印 加密 密文语音 检索
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3;TP309.7
【目录】:
- 摘要6-7
- Abstract7-11
- 第1章 绪论11-19
- 1.1 课题的研究背景及意义11-12
- 1.2 国内外研究现状12-17
- 1.2.1 语音感知哈希技术研究现状12-16
- 1.2.2 语音检索研究现状16-17
- 1.3 本文主要研究内容17-18
- 1.4 本文结构18-19
- 第2章 语音感知哈希及音频检索技术19-29
- 2.1 语音感知哈希19-25
- 2.1.1 感知哈希的定义19-20
- 2.1.2 感知哈希的性质20-22
- 2.1.3 感知哈希的评价标准22-24
- 2.1.4 感知哈希技术对于音频检索的意义24-25
- 2.2 音频检索技术25-28
- 2.2.1 音频检索的研究现状25
- 2.2.2 基于内容的音频检索框架25-27
- 2.2.3 索引生成27
- 2.2.4 检索方法27-28
- 2.2.5 检索性能评价28
- 2.3 本章小结28-29
- 第3章 基于时域-频域趋势变化的语音感知哈希方案29-40
- 3.1 概述29-31
- 3.2 时域感知哈希生成31
- 3.3 频域感知哈希生成31-34
- 3.4 时域-频域感知哈希结合方法34
- 3.5 实验结果与性能分析34-39
- 3.5.1 感知哈希区分性分析34-35
- 3.5.2 感知哈希鲁棒性分析35-38
- 3.5.3 感知哈希其他性能分析38-39
- 3.6 本章小结39-40
- 第4章 基于感知哈希的密文语音检索方案40-51
- 4.1 概述40
- 4.2 语音加密算法40-43
- 4.3 密文语音水印嵌入算法43-45
- 4.4 基于感知哈希的密文语音检索方案45-46
- 4.5 实验及结果分析46-49
- 4.6 本章小结49-51
- 总结与展望51-53
- 致谢53-54
- 参考文献54-58
- 攻读硕士学位期间发表的论文及科研成果58
【引证文献】
中国硕士学位论文全文数据库 前1条
1 任刘姣;感知哈希及其在语音检索与认证中的应用[D];西南交通大学;2016年
,本文编号:525244
本文链接:https://www.wllwen.com/kejilunwen/wltx/525244.html