面向图像检索的深度汉明嵌入哈希
发布时间:2024-05-25 03:33
深度卷积神经网络学习的图像特征表示具有明显的层次结构.随着层数加深,学习的特征逐渐抽象,类的判别性也逐渐增强.基于此特点,文中提出面向图像检索的深度汉明嵌入哈希编码方式.在深度卷积神经网络的末端插入一层隐藏层,依据每个单元的激活情况获得图像的哈希编码.同时根据哈希编码本身的特征提出汉明嵌入损失,更好地保留原数据之间的相似性.在CIFAR-10、NUS-WIDE基准图像数据集上的实验表明,文中方法可以提升图像检索性能,较好改善短编码下的检索性能.
【文章页数】:9 页
【部分图文】:
本文编号:3981644
【文章页数】:9 页
【部分图文】:
图1DHEH模型架构
图1给出DHEH的模型架构.它是一个端到端的深度哈希学习框架,由一个基于CNN的图像分类模块及一个汉明嵌入模块构成.前者用于图像表示学习,后者用于控制哈希编码之间的相似性保留.DHEH采用AlexNet深度架构[16]作为它的深度卷积神经网络部分.深度网络共包含5个卷积层、2个全....
图2DHEH在2个数据集上的平均精确率均值
由图2和图3可见,同时进行汉明嵌入学习的模型在2个数据集上不同编码长度下的性能均优于仅进行图像表示学习的模型,这体现汉明嵌入学习的重要性.图3DHEH在2个数据集上的precision@5k
图3DHEH在2个数据集上的precision@5k
图2DHEH在2个数据集上的平均精确率均值图4为DHEH在规模较大的NUS-WIDE数据集上短编码(12bit)与长编码(48bit)时的precision-recall曲线.
图4DHEH在不同编码长度下的precision-recall曲线
实验表明,同时进行汉明嵌入学习的模型能更好地控制相似性信息的保留,进一步验证汉明嵌入损失的有效性.3结束语
本文编号:3981644
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3981644.html