深度分段哈希图像检索算法设计与实现
发布时间:2021-04-07 01:37
随着网络上图像数据的日益增多,对图像中最近邻的搜索需求也日益增多。而图像哈希在该方面因为计算速度快、存储空间少等优势被广泛重视,因而涌现了很多优秀的算法。但是,这些算法中仍然存在着一些问题需要解决。首先,传统无数据依赖哈希方法通用性强、运行速度快,但是在结果准确率上却不占优势。然后,现在普遍使用的基于卷积神经网络的图像哈希算法虽然准确率高,但是需要训练专门的哈希生成网络,训练时间和存储空间需求大。再者,很多使用神经网络的图像哈希算法往往不能确定将何种信息编码进了哈希码中,编码具有很大的语义不可控性。对于上述问题,深度分段哈希算法给出了对应解决方案。首先,针对传统哈希方法准确率低的问题,算法将图像特征提取任务交给了卷积神经网络,但是对特征的处理上使用传统图像处理方法,既保留了准确率又保留了计算速度。然后,对于卷积神经网络训练时间和空间需求大的问题,算法所需网络直接采用分类神经网络,不需要针对哈希算法专门训练网络,实现了网络模型的共用,从共用角度减少了网络训练时间和存储空间。最后,关于哈希编码的语义不可控性问题,算法采用分段的策略,将整体哈希码按照不同语义分段编码,利用分类神经网络和显著性...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
所示,图像哈希的方法是将每一幅图像压缩成一段二值哈希码,将检图1-1图像哈希算法应用示例
图 1-2 图像哈希算法类型大约过了 10 年后的当代,大量的图片通过互相分享和传播出现在互联网上,使方便地从网络中获得大量图片并进行标签统计,这也促进了数据依赖类方法发展。更进一步,数据依赖方法又可以进而分为有监督方法和无监督方法,于两者之间的半监督方法。无监督方法不使用图像的标签进行网络的训练,法中有代表性的算法有谱哈希(spectral hashing, SH)[11]算法、迭代量rative quantization, ITQ)[11]、各向同性散列(isotropic hashing, IsoH散图哈希(discrete graph hashing, DGH)[23]、可伸缩图哈希(scalable grang, SGH)[21]、序数嵌入哈希(ordinal embedding hashing, OCE)[24]和语觉哈希(semantic-assisted visual hashing, SAVH)[23]等。然而,由于无法没有使用语义级别的标签信息进行训练的指导,使得结果有很多局限性。在有监督哈希算法中,有代表性的算法有内核监督哈希(supervised hashin[9][10]
并且将显著性结果编码至哈希码中。本章接下来将分别介绍本文所提算法中使用到的技术,简述其原理和发展。2.1 图像检索如图 2-1 所示,在基于内容的图像检索中,目的是通过对图像内容的判断和统计来查询图像相似的图像,所以在该项任务中,图像的表示方式和相似性的比较方式都是至关重要的环节。在现在为止的大量研究中,其中最具挑战性的任务之一就是如何将人类的图像的感知和图像的像素级别的信息连接起来。对于人类的视觉系统来说,识别一幅图像中的物体都是什么并不是一件难事,而且一个普通的正常人类都可以在很短的时间内对图像物体进行判断,而这也是人类其他各种日常活动的基础,但是对于计算机来讲,计算机所能感受到的是像素数字,并不能直接通过像素理解图像的高级语义。
本文编号:3122549
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
所示,图像哈希的方法是将每一幅图像压缩成一段二值哈希码,将检图1-1图像哈希算法应用示例
图 1-2 图像哈希算法类型大约过了 10 年后的当代,大量的图片通过互相分享和传播出现在互联网上,使方便地从网络中获得大量图片并进行标签统计,这也促进了数据依赖类方法发展。更进一步,数据依赖方法又可以进而分为有监督方法和无监督方法,于两者之间的半监督方法。无监督方法不使用图像的标签进行网络的训练,法中有代表性的算法有谱哈希(spectral hashing, SH)[11]算法、迭代量rative quantization, ITQ)[11]、各向同性散列(isotropic hashing, IsoH散图哈希(discrete graph hashing, DGH)[23]、可伸缩图哈希(scalable grang, SGH)[21]、序数嵌入哈希(ordinal embedding hashing, OCE)[24]和语觉哈希(semantic-assisted visual hashing, SAVH)[23]等。然而,由于无法没有使用语义级别的标签信息进行训练的指导,使得结果有很多局限性。在有监督哈希算法中,有代表性的算法有内核监督哈希(supervised hashin[9][10]
并且将显著性结果编码至哈希码中。本章接下来将分别介绍本文所提算法中使用到的技术,简述其原理和发展。2.1 图像检索如图 2-1 所示,在基于内容的图像检索中,目的是通过对图像内容的判断和统计来查询图像相似的图像,所以在该项任务中,图像的表示方式和相似性的比较方式都是至关重要的环节。在现在为止的大量研究中,其中最具挑战性的任务之一就是如何将人类的图像的感知和图像的像素级别的信息连接起来。对于人类的视觉系统来说,识别一幅图像中的物体都是什么并不是一件难事,而且一个普通的正常人类都可以在很短的时间内对图像物体进行判断,而这也是人类其他各种日常活动的基础,但是对于计算机来讲,计算机所能感受到的是像素数字,并不能直接通过像素理解图像的高级语义。
本文编号:3122549
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3122549.html
最近更新
教材专著