基于深度二阶哈希的图像检索研究

发布时间:2021-06-19 07:55
  随着时代的高速运转,网络图像和视频数据与日俱增,哈希技术因存储效率高、查询速度快在图像检索领域应用广泛。由于在计算机视觉中卷积神经网络表现突出,深度哈希模型走进人们的视野。然而,目前的深度哈希方法捕获图像特征严重依赖于一阶卷积特征统计,忽略全局结构。为了解决这个问题,论文从模型构建和约束优化的角度循序渐进,利用协方差估计建立有效的深度二阶哈希方法,摆脱图像特征的片面性,为哈希研究开拓了新的方向,具体工作如下:(1)提出了基于类别监督的深度二阶哈希检索模型。以深度哈希方法为基础,利用幂归一化来估计稳健协方差,形成独立结构层,然后按照逐点标签的方式将其嵌入深度网络探索二阶统计信息,并分别借助基于软分配和二分配的交叉熵约束端对端训练实现类别监督,获得全局性和针对性兼备的哈希码。该模型根据top-k精度、准确率-召回率、平均准确率均值三种指标在四个哈希编码位上进行评估,在MNIST、CIFAR-10及NUS-WIDE三个数据集上的表现均优于其他一阶深度哈希算法,说明了所提方法的有效性,有力解决深度哈希捕获图像特征的弱全局性问题。(2)提出了基于双标签的深度二阶哈希检索模型。在基于类别监督的深度... 

【文章来源】:大连大学辽宁省

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

基于深度二阶哈希的图像检索研究


哈希学习示意图

框架图,哈希,类别,框架图


忍卣骼幢硎就枷裥畔ⅰ?本章工作的贡献点包括:(1)基于逐点标签学习的单输入方式,将协方差估计的高阶信息融合至深度哈希架构中,提出基于类别监督的深度高阶哈希新框架。(2)以交叉熵约束为前提,针对多分类和多标签任务采用不同的概率预测方式,端对端的训练强化哈希编码的语义判断性能。(3)我们的方法在MNIST[6]、CIFAR-10[7]及多标签数据集NUS-WIDE[8]上分别进行验证,实验结果体现了该基于逐点标签监督的深度高阶哈希框架保证特征通道的相关性,确定稳健的特征分布,在性能上较其他几种深度哈希算法更优异。图2.1基于类别信息监督的深度二阶哈希框架图Fig.2.1ArchitectureoftheSupervisedDeepSecond-orderCovarianceHashing2.2模型介绍图2.1展示了基于类别监督的深度二阶哈希架构的网络结构设计图,它主要包括四个子网络,分别对应基础特征、高阶池化、哈希映射和语义分类。如图2.1所示,基础特征子网络实现提图像表征的提取,高阶池化子网络主要由协方差(COV)、特征值分解(EIG)、幂归一化(Power)组成,实现以协方差估计为基础的全局统计,哈希映射子网络用来实现哈希激活和编码,语义分类子网络是实现类别监督和架构优化的交叉熵约束。这四个子网络逐层衔接,正反向传播实现网络优化,最终确立全局性和细节性相统一的哈希特征表示。考虑到该架构的优化是建立在基于类别信息的语义分类子网络上的,所以需要定义图像输入集,在此将整个图像集表示为1,,NXxx,其中,1,,ixiN表示数据集中的

示意图,实验数据,示意图,数据集


-15-及NUS-WIDE上开展性能测试。本节主要包括四个部分:数据集及相关实验设置,MNIST实验结果描述与分析,CIFAR-10实验结果与分析,NUS-WIDE实验结果描述与分析。所有实验均使用深度学习工具箱MatConvNet[69],依托于配备3.30GHzCPU,64GBRAM及NVIDIAGTX1080GPU的PC机,借助MATLABR2014b开展实施。2.4.1数据集及相关实验设置本文选择三个经典的基准数据集开展实验评估方法的有效性,图2.2展示了数据集的示意图,下面详细介绍各数据集。图2.2实验数据集示意图Fig.2.2TheschematicdiagramofexperimentaldatasetMNIST[6]:该数据集包含70000张从0到9这0个类别的手写数字组成灰度图像集,每类含有7000个样本,且其像素点为28×28。它的每张图片仅与一个标签相匹配,是一个单标签数据集。CIFAR-10[7]:该数据集是一个彩色图像组成的单标签数据集,尺寸为32×32总共60000张,作为哈希方法性能评判使用最广泛的数据集之一,它包含10个类别,每类具有6000个样本。NUS-WIDE[8]:不同于上面两个图像集,它是一个公共的多标签数据集,包含了将近270k张来源于网络的图片,每个样本与81个属性中的一个或多个相匹配,且各类别下的图片个数不平均。与文献[9][10]的设置类似,根据各属性下图片数目的多少,我们选择了21个最常见的属性下的195834幅图片,其中每个属性下至少包含5000张彩色图片[9,10]。

【参考文献】:
硕士论文
[1]基于深度哈希的图像示例搜索算法研究[D]. 徐祥锋.南京邮电大学 2019
[2]基于哈希学习的图像数据快速检索方法研究[D]. 童鹏鹏.哈尔滨工程大学 2019
[3]基于深度学习和哈希的图像检索的方法研究[D]. 何涛.电子科技大学 2018



本文编号:3237425

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3237425.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0b061***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com