基于特征性能增强和目标定位的图像检索研究
发布时间:2021-04-03 01:12
随着互联网技术的快速发展以及手机、相机等数码产品的普及,互联网上流传的图像数量越来越庞大,且图像中的内容也越来越复杂多样。在海量图像中快速准确的检索出需要的图像已成为热门的研究课题。如何提取具有强表征性能的图像特征以及如何精确定位出图像中的感兴趣区域是近年来图像检索领域的重点研究方向。基于此背景,本文运用深度卷积神经网络,提出了基于特征性能增强和目标定位的图像检索方法。本文主要有两个创新点:一是改进CroW特征加权方法,提出新的卷积特征性能增强方法。在通道加权和平面加权后,使用多尺度的池化窗口在图像卷积特征上滑动得到多个局部特征向量,然后整合成全局特征向量,实验表明该特征向量具有很强的图像表征性。二是本文将基于深度学习的目标检测方法与图像检索方法相结合,提出了基于目标定位的图像检索方法。使用重新训练的SSD目标检测模型定位出图像中需要的目标区域,根据目标区域提取区域特征进行图像检索。该方法对图像的特定区域进行针对性的特征提取,可以最大限度的过滤掉图像干扰因素,极大提高检索精度。本文的主要贡献有三个:一是使用手工标注的建筑物数据集训练SSD模型,得到能准确检测出图像建筑物区域的目标检测器...
【文章来源】:西安理工大学陕西省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
卷积特征加权示意图
计算通道权重:对特征上每个通道k都分配一个权值 。特征整合:每个特征图进行和池化处理,将三维特征整合成单维全局特征向量向量归一化:将得到的向量归一化和再转换,这里可以使用各种方法。降维:降低了归一化向量的维数。可以选择典型的 PCA 降维,也可以选择白化度缩放方法。用 CroW 方法得到的特征向量有两个特点:一是紧凑的表达,整个特征向量从最三维卷积特征压缩成单维的向量,从数据量来说缩小了几十倍;二是放大原卷积区域的影响力,即,特征图上更可能存在物体的区域加大了权重,梯度差异大的了权重。-MAC 区域整合方法-MAC 特征处理方法的方法和 MOP[37]方法类似,都采用一种变窗口的方式在平处理。差别是 MOP 设计的窗口是在图像上滑动,而 R-MAC 的窗口在特征图上者大大加快了特征处理的速度。另外,MOP 采用的是 VLAD 的方式进行合并法则是直接将局部特征向量相加得到最终的全局特征向量,更简单快捷。
西安理工大学工程硕士专业学位论文难度。该方法将目标检测框架看作回归问题,在单个神经网络中直接输出预测边界框和类别概率。其检测精度上提升到了 63.4%,在检测速度上也远远快于 R-CNN。随着研究的深入,后来又提出了 SSD 方法,该方法在 VOC2007 上的检测精度一直处于领先地位,达到了 72.1%。
本文编号:3116318
【文章来源】:西安理工大学陕西省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
卷积特征加权示意图
计算通道权重:对特征上每个通道k都分配一个权值 。特征整合:每个特征图进行和池化处理,将三维特征整合成单维全局特征向量向量归一化:将得到的向量归一化和再转换,这里可以使用各种方法。降维:降低了归一化向量的维数。可以选择典型的 PCA 降维,也可以选择白化度缩放方法。用 CroW 方法得到的特征向量有两个特点:一是紧凑的表达,整个特征向量从最三维卷积特征压缩成单维的向量,从数据量来说缩小了几十倍;二是放大原卷积区域的影响力,即,特征图上更可能存在物体的区域加大了权重,梯度差异大的了权重。-MAC 区域整合方法-MAC 特征处理方法的方法和 MOP[37]方法类似,都采用一种变窗口的方式在平处理。差别是 MOP 设计的窗口是在图像上滑动,而 R-MAC 的窗口在特征图上者大大加快了特征处理的速度。另外,MOP 采用的是 VLAD 的方式进行合并法则是直接将局部特征向量相加得到最终的全局特征向量,更简单快捷。
西安理工大学工程硕士专业学位论文难度。该方法将目标检测框架看作回归问题,在单个神经网络中直接输出预测边界框和类别概率。其检测精度上提升到了 63.4%,在检测速度上也远远快于 R-CNN。随着研究的深入,后来又提出了 SSD 方法,该方法在 VOC2007 上的检测精度一直处于领先地位,达到了 72.1%。
本文编号:3116318
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3116318.html
最近更新
教材专著