基于卷积神经网络的实例图像检索
发布时间:2021-07-07 16:38
人工智能时代,以卷积神经网络为代表的深度学习技术在计算机视觉领域的各项任务中大放异彩。在图像检索方面,基于卷积神经网络的图像表示模型表现十分优异。然而这种优异的表现更多地体现在相似性图像检索任务中,在实例级的图像检索任务中的表现仍缺乏竞争力。实例图像检索任务对技术的要求更为苛刻,也有具有更广泛的应用前景。本文认为深度方法在图像检索方面取得的成果表现平庸的原因主要是存在以下四点问题:1)现有的基于卷积神经网络框架的实例检索系统大多都选择使用已经在ImageNet数据集上预训练好的网络模型来作为特征提取器,然而ImageNet数据集是针对分类(相似性图像检索)任务而设计的,这样学习出的图像特征是用来区分图片的不同语义类别的,这样的特征对于类内的变异具有较强的鲁棒性,但是实例图像检索的任务是去区分特定的对象,而不是两张图片是否属于相同的语义类别。2)不适合实例图像检索的网络结构与训练过程。3)没有充分的利用卷积神经网络模型的学习能力,目前很多方法都只是将卷积神经网络当做一个局部特征提取工具,仍需要进一步对特征进行手工计算得到滤波参数,没有实现端到端的网络模型。4)次优的激活函数,大部分进行实...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
近年来实例图像检索发展历程
第一章绪论局部特征,并采用 VLAD 将每个尺度上的局部特征编码为该尺度上的图像特征。最后一部分是将所有尺度的图像特征连接在一起构成最终的图像特征。MOP-CNN 提取图像特征的框架见图 1.2。该篇文章还分别在分类和实例检索两个任务上进行了测试,证明了相比于一般的 CNN 全局特征 MOP-CNN 具有更好的搜索效果。
图 1. 3 利用卷积层特征并进行 VLAD 编码特征模型这些通过将 CNN 提取的全局图像特征利用 VLAD,FV 等算法进行特征编码的研究方法都取得了不错的成绩,SIFT 特征与 CNN 特征的主要区别在于后者在每个维度上都有明确的含义,也就是对输入图像的特定区域的滤波器相应。因此,除了上面提到的编码方案以外,对 CNN 特征进行直接池化的技术也可以产生可以用来区分实例的特征。这方面的取得重要成果的工作是来自 Tolias[6]等人提出的最大卷积激活(MAC,Maximum activation of convolutions)。在图像没有被扭曲或裁剪的情况下MAC 用单个向前传递来计算全局描述符,MAC 只计算每个中间映射的最大值,然后把所有这些值串联在一个卷积层内。在 Tolias 等人在 MAC 的基础上改进的 R-MA(Regional maximum activation of convolutions)的版本中,使用积分图算法和最似最大算子进行快速计算。最后局部的 MAC 描述符在一系列归一化和 PCA 白化的操作下被统一合并。同时也有研究表明,在利用池化技术直接产生具有区分度的图像特征的过程中,在池化之前对每层的特征图谱分配一定的权重是非常有用的。Babenko 等
本文编号:3269985
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
近年来实例图像检索发展历程
第一章绪论局部特征,并采用 VLAD 将每个尺度上的局部特征编码为该尺度上的图像特征。最后一部分是将所有尺度的图像特征连接在一起构成最终的图像特征。MOP-CNN 提取图像特征的框架见图 1.2。该篇文章还分别在分类和实例检索两个任务上进行了测试,证明了相比于一般的 CNN 全局特征 MOP-CNN 具有更好的搜索效果。
图 1. 3 利用卷积层特征并进行 VLAD 编码特征模型这些通过将 CNN 提取的全局图像特征利用 VLAD,FV 等算法进行特征编码的研究方法都取得了不错的成绩,SIFT 特征与 CNN 特征的主要区别在于后者在每个维度上都有明确的含义,也就是对输入图像的特定区域的滤波器相应。因此,除了上面提到的编码方案以外,对 CNN 特征进行直接池化的技术也可以产生可以用来区分实例的特征。这方面的取得重要成果的工作是来自 Tolias[6]等人提出的最大卷积激活(MAC,Maximum activation of convolutions)。在图像没有被扭曲或裁剪的情况下MAC 用单个向前传递来计算全局描述符,MAC 只计算每个中间映射的最大值,然后把所有这些值串联在一个卷积层内。在 Tolias 等人在 MAC 的基础上改进的 R-MA(Regional maximum activation of convolutions)的版本中,使用积分图算法和最似最大算子进行快速计算。最后局部的 MAC 描述符在一系列归一化和 PCA 白化的操作下被统一合并。同时也有研究表明,在利用池化技术直接产生具有区分度的图像特征的过程中,在池化之前对每层的特征图谱分配一定的权重是非常有用的。Babenko 等
本文编号:3269985
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3269985.html
最近更新
教材专著