基于区域评价和关系建模的图像检索研究

发布时间:2024-07-04 20:09
  基于内容的图像检索(CBIR),俗称“以图搜图”,一直以来都是计算机视觉领域的基础研究课题,其对相关研究领域有着深远的影响,并有着广泛的商业应用。随着网络上的多媒体数据呈现爆炸式地增长以及自动驾驶,增强现实等越来越多实际应用的需求,图像检索成为一个基础且具有实际意义的研究课题。近年来,深度学习方法和理论在人工智能,模式识别的代表性研究方向如物体识别,语音识别,物体检测等任务取得了巨大成功。图像检索领域也毫无例外地将传统方法与深度卷积神经网络(CNN)特征相结合,进行编码和聚合得到紧凑的全局描述符表示。CNN特征具有表示能力强,维度低等优点,逐渐在工业界和学术界被广泛应用。本篇论文的研究工作主要在两类图像检索数据集展开:标准物体检索数据集和地理位置检索数据集。两种数据集可以进一步划分为单物体图像检索和多物体图像检索数据集。虽然近年的工作将这些数据集的检索准确度提升到了很高的层次,现今的方法仍存在一些待改进的地方。本文也通过改进现有的方法进一步提升了图像检索准确度。本文的研究工作主要包括:(1)有效解决过度计数问题。自然图像中的物体或多或少具有重复结构,尤其在建筑物上最为常见。之前的一些工...

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究的背景、内容及意义
    1.2 国内外研究现状
        1.2.1 基于深度学习特征的图像检索研究现状
        1.2.2 主要存在的问题
    1.3 本文的内容以及章节安排
        1.3.1 本文的研究内容
        1.3.2 本文的组织结构
第2章 相关技术基础理论
    2.1 基于深度学习特征的图像检索
        2.1.1 卷积神经网络模型
        2.1.2 基于深度特征的图像检索
    2.2 注意力机制
    2.3 视觉关系建模框架
    2.4 网络训练
        2.4.1 分类损失函数
        2.4.2 度量学习方法
    2.5 特征降维
    2.6 图像检索数据集
        2.6.1 数据集难点
        2.6.2 评价指标
    2.7 本章小结
第3章 基于区域评价的图像检索
    3.1 深度区域特征
    3.2 网络结构
        3.2.1 金字塔池化
        3.2.2 注意力模块与级联注意力模块
    3.3 PCA幂白化
    3.4 实验配置
    3.5 实验结果
        3.5.1 区域选择
        3.5.2 注意力模块
        3.5.3 PCA幂白化
        3.5.4 与当前先进方法比较
        3.5.5 标准图像检索实验
    3.6 本章小结
第4章 基于关系建模的图像检索
    4.1 图像检索假设中关系信息的缺失
    4.2 区域关系模块
    4.3 级联池化方法
    4.4 实验配置
        4.4.1 网络训练
        4.4.2 网络测试
    4.5 实验结果
        4.5.1 关系特征图与级联池化
        4.5.2 关系描述符与外观描述符
        4.5.3 图像检索示例
        4.5.4 关系特征分析
        4.5.5 与当前先进方法比较
        4.5.6 标准图像检索实验
        4.5.7 RelationVLAD
        4.5.8 实验结果对比以及定性分析
    4.6 本章小结
第5章 总结和展望
参考文献
致谢
攻读硕士学位期间的研究成果



本文编号:4000475

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4000475.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4ad7b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com