当前位置:主页 > 科技论文 > 网络通信论文 >

用于大规模图像检索的哈希编码方法的研究

发布时间:2020-10-20 03:35
   图像是人类对于自然景物的视觉认知基础,是人类社会活动中最常用的信息载体。随着互联网的发展、大数据时代的到来、图像采集工具的普及,生活中出现了越来越多的图像,人们对于大规模图像检索的要求也越来越高。当前大规模图像数据库的检索有着图像数据量大、特征维度高以及要求响应的时间短等特点,基于内容的图像检索在新的情况下面临着新的挑战。原始的线性扫描方法虽然有着较高的检索精度,但是它的检索的过程需要较长的时间和较多的内存资源。基于树的图像检索方法在处理低维数据时较线性扫描有较大提升,但是在处理高维数据时其检索效率大幅度下降,使得基于树的图像检索方法无法适用于大规模图像的检索,为此基于哈希的图像检索方法被提了出来。基于哈希的图像检索方法将图像的特征转变为哈希码,使用汉明距离来比较图像的相似性,可以大大减少计算机的内存消耗和检索响应时间,因而它能更好的适用于大规模图像的检索。该文在用于大规模图像检索的哈希编码方法方面做了大量的研究,论文的主要工作和贡献总结如下:首先,为了降低哈希图像检索编码时的信息损失问题,设计了一种最小损失哈希的图像检索算法。通过结合主成分分析与拉普拉斯特征映射,将原始高维数据进行降维处理;然后对特征降维和二进制量化的损失函数求极值得到哈希函数;最后,哈希函数将原始特征矩阵转换为哈希码矩阵,计算图像哈希码间的汉明距离得到图像的相似性。该文所提出的方法分别在四个数据集上进行实验,并与领域相关方法进行比较。实验结果表明文中提出的方法可以更好的保护数据的近邻特征和降低量化编码过程中的信息损失,提高了检索精度。其次,为了解决单比特量化无法很好的保护特征的近邻结构以及曼哈顿量化检索时耗时过多的缺点,设计了一种使用位运算的双比特高效量化方法。该方法采用一种新的编码方法,在二值编码时加入数据的位置信息,用来表示数据之间的近邻关系。在距离计算时设计一种经过微调的汉明距离度量方法,使得在距离计算时充分发挥计算机高效的位运算能力,以此来提高计算速度。该方法分别在四个数据集上进行实验,并与现有的量化方法进行比较,实验结果表明该量化方法确实在检索速度和检索精度方面均有优势。
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TN919.81
【部分图文】:

计算图,示例,哈希,欧式空间


图 1.1 KD 树的简单示例哈希的图像检索算法的研究现状希的图像检索方法将原始图像特征映射到汉明空间中,使用哈希,可有效提高检索的效率。其中汉明空间也就是得到的哈希码所,哈希函数的作用就是将欧式空间的特征数据离散化到汉明空希编码阶段将在欧式空间相似的图像特征映射到汉明空间中,那码也应该是相似的,这就是哈希保护近邻关系的特性。在进行图储图像的哈希码,这就甩掉了存储大量原始图像带来的内存消之间的相似性方面,哈希图像检索可以使用计算机内部计算器来计算图像之间的汉明距离,从而大幅度降低检索的响应时间得到的哈希码一般都要低于图像的原始特征,这可以有效解决

哈希算法,哈希表,量化过程,哈希


由原始数据点得到二值哈希码在数学上是一个 NP 困难的问题,所以现有的哈希算法大都是将这个过程分为映射和量化两个阶段来处理的。现在映射阶段有许多哈希函数的设计方法。比如数据独立哈希方法通常使用随机投影,数据依赖哈希利用数据的分布信息以及各种监督信息来确定哈希函数的最优参数。现在最常用的是广义线性投影形式的哈希函数,如下公式 2.1 所示:( ) sgn( ( ))Tk k kh x f w x b(2.1)这里的 f ( )是一个预定义的函数,也可能是非线性的。式中要确定的参数是1{ ,b }Kk k kw ,分别是指映射向量和相对应的常数项。在量化阶段,虽然现在有一些用于量化的方案,但还需要研究者们投入更多的精力。量化一般是将将投影向量转化为一定长度的二进制哈希码。当前,大多数哈希方法使用的是基于阈值的单比特量化方法,这种方法根据阈值将每个投影维度的数据二值化为 0 和 1。

框架图,哈希,图像检索,框架


图 2.2 基于哈希的图像检索框架基于哈希的图像检索一般框架如图 2.2 所示,整个过程大致分为特征提取、哈希编码、汉明距离排序和重排四个步骤[62]。(1) 特征提取。首先要对整个图像数据库进行特征提取,这里使用的图像特征一般是颜色特征、GIST 特征、CNN 特征等高维全局特征。(2) 哈希编码。这个过程一般分为映射和量化两个步骤。先将原始图像特征通过哈希函数映射到汉明空间,然后使用量化策略将汉明空间的值量化为二值哈希码,最后每张图像都获得一定长度的二进制串。(3) 汉明距离排序。将查询图像的哈希码与数据库中每张图像的哈希码值计算汉明距离,按照得到了汉明距离将图像排序。(4) 重排。在实际的工程应用中会有重排这一步,将汉明距离排序后的前 K 张图像使用欧氏距离再计算他们的相似度,得到最后的结果。在研究哈希算法时一般不需这步。
【相似文献】

相关期刊论文 前10条

1 陈涛;;基于多示例学习的图像检索方法[J];网络安全技术与应用;2019年04期

2 乐艺;;基于机器学习的大规模船舶图像检索机制[J];舰船科学技术;2019年18期

3 方恩亮;细胞分裂方式图像检索[J];中学生物教学;1996年02期

4 冀振燕;姚伟娜;皮怀雨;;个性化图像检索和推荐[J];北京邮电大学学报;2017年03期

5 何岩;;以计算机为基础的色彩图像检索方法与研究[J];计算机光盘软件与应用;2013年12期

6 陈雅芳;;基于颜色特征与纹理特征的图像检索[J];硅谷;2012年06期

7 张丽丽;刘昌余;;基于盲取证的医学图像检索及语义表达研究综述[J];电脑知识与技术;2012年22期

8 曹梅;;网络图像检索行为与心理研究[J];中国图书馆学报;2011年05期

9 崔文成;邵虹;;基于遗传算法的图像检索中特征权重自动调整[J];计算机工程与应用;2008年02期

10 聂桂军;周源;;图像检索研究进展[J];南京工业职业技术学院学报;2008年02期


相关博士学位论文 前10条

1 李莹;图像检索中的特征表达与排序研究[D];大连理工大学;2019年

2 周菊香;图像检索中的特征表达和相似性度量方法研究[D];大连理工大学;2019年

3 刘若愚;图像检索中的特征学习和索引技术研究[D];北京交通大学;2019年

4 田星;动态环境下的图像检索问题研究[D];华南理工大学;2019年

5 周容;基于轮廓的图像检索研究[D];上海交通大学;2016年

6 于来行;基于视觉注意模型的图像检索方法研究[D];大连理工大学;2018年

7 苏雯;语义分割及其在图像检索中的应用[D];中国科学技术大学;2018年

8 张宪林;基于草图的图像检索关键技术研究[D];北京邮电大学;2019年

9 李珂;基于草图的精细图像检索[D];北京邮电大学;2019年

10 苏琨;手指静脉图像检索与融合识别方法研究[D];山东大学;2019年


相关硕士学位论文 前10条

1 王一霄;基于深度学习的图像检索研究[D];电子科技大学;2019年

2 王培雷;基于残差网络的多标签图像检索方法研究[D];桂林电子科技大学;2019年

3 王娟;基于社会化标签和显著性区域的深度学习图像检索方法[D];西北大学;2019年

4 赵恒川;基于语义的交互式图像检索[D];电子科技大学;2019年

5 艾妮;图像检索中局部特征聚合的研究[D];吉林大学;2019年

6 苗壮;熵在图像检索领域的应用算法研究[D];吉林大学;2019年

7 郭慧俐;面向区域表达的实例检索方法研究[D];吉林大学;2019年

8 杜安钰;基于隐私保护的多特征图像检索算法研究[D];新疆大学;2019年

9 陈建华;基于多特征融合与LSH的密文图像检索研究[D];中南林业科技大学;2019年

10 吕明;基于多特征编码的图像检索[D];河南大学;2019年



本文编号:2848146

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2848146.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户082e6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com