利用显式引导注意力机制的图像检索深度哈希方法研究
发布时间:2021-05-06 02:18
在相当长的一段时间里,随着移动端影像技术和新兴社交网站的快速发展,照片和视频等视觉数据呈现爆炸性增长的趋势,这些视觉数据中蕴含着巨量的信息,早已引起了学术界和工业界对高效的视觉数据检索算法的探索兴趣。精确的最近邻搜索方法对时间和算力的要求都很高,而视觉数据又有存储、计算开销大,视觉到语义信息表示困难等问题,这都成为视觉数据检索算法面临的挑战。由于哈希检索方法在存储、计算上表现出的效率优势,以及深度方法在视觉数据上表现出的无可比拟的特征提取能力,二者结合的深度哈希方法成为了应对视觉数据检索问题非常有前景的重要方法。由于卷积神经网络的图像特征提取能力可以轻松超过手工设计特征,因此大多数端到端的深度哈希方法直接使用全连接层的输出来近似哈希码,通过编码全局语义信息学习哈希函数。而在图像检索任务中,图像中可能存在多个实例,模型应当关注的是那些与检索目标高度相关的局部的信息,至于周边的背景信息对于检索任务则是冗余的,甚至有干扰性,图像空间局部信息的损失可能是模型检索性能瓶颈的原因之一。注意力机制是公认的发掘对任务贡献度高的局部信息好的方法,它是一种普适性的思路,没有严格的数学定义,很多深度模型把它...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 图像检索哈希方法
1.2.2 计算机视觉领域的注意力机制
1.3 本文主要工作
1.4 本文组织结构
第二章 模型与算法设计
2.1 模型概述
2.2 显式引导的空间注意力生成机制
2.2.1 从前馈角度设计局部类别预测概率
2.2.2 对局部类别预测概率进行直接优化
2.2.3 生成空间注意力图
2.3 哈希码生成流
2.3.1 损失函数设计
2.3.2 优化过程
2.4 训练和检索算法
2.5 卷积特征与原图像的空间对应关系
2.6 本章小结
第三章 性能验证与分析
3.1 数据集
3.2 评价标准和对比方法
3.3 实验设置
3.4 实验与结果分析
3.4.1 最优训练策略
3.4.2 对比方法结果比较
3.4.3 消融实验
3.4.4 空间注意力图可视化
3.5 本章小结
第四章 总结与展望
4.1 总结
4.2 展望
参考文献
致谢
学位论文评阅及答辩情况表
本文编号:3171043
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 图像检索哈希方法
1.2.2 计算机视觉领域的注意力机制
1.3 本文主要工作
1.4 本文组织结构
第二章 模型与算法设计
2.1 模型概述
2.2 显式引导的空间注意力生成机制
2.2.1 从前馈角度设计局部类别预测概率
2.2.2 对局部类别预测概率进行直接优化
2.2.3 生成空间注意力图
2.3 哈希码生成流
2.3.1 损失函数设计
2.3.2 优化过程
2.4 训练和检索算法
2.5 卷积特征与原图像的空间对应关系
2.6 本章小结
第三章 性能验证与分析
3.1 数据集
3.2 评价标准和对比方法
3.3 实验设置
3.4 实验与结果分析
3.4.1 最优训练策略
3.4.2 对比方法结果比较
3.4.3 消融实验
3.4.4 空间注意力图可视化
3.5 本章小结
第四章 总结与展望
4.1 总结
4.2 展望
参考文献
致谢
学位论文评阅及答辩情况表
本文编号:3171043
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3171043.html
最近更新
教材专著