基于显著性检测的图像检索方法研究
发布时间:2021-10-19 23:10
基于内容的图像检索技术旨在根据用户提供的输入图像,寻找在图像库中相同或相似的图像作为输出。此技术如今被用在了诸多领域,在网络购物方面,用户可以利用此技术快速寻找自己想要的商品。在医疗方面,可以用此技术进行病症搜索,寻找身体中可能出现疾病的部位,防范于未然。虽然当今图像检索技术已有长足发展,但现有方法的检索效果仍然有进步的空间。当前大多数方法使用了基于深度学习的技术,能够在原图中提取出许多表征能力强的高维特征,但其对主体信息的提取与表达依然不够理想,从而会对检索结果产生不利影响。本文针对上述问题,提出了基于显著性检测的两段式图像检索模型。在模型的第一阶段,本文会对图像中的主体目标进行处理与抽取,第二阶段则利用抽出的图像主体进行特征提取。针对现有方法对图像中主体信息提取得不够好、对图像中上下文信息的融合做得还不够到位的问题,本文提出了基于多注意力的显著性目标检测方法,即本文的第一阶段。此方法在注意力提取方面,通过上下左右四个方向的扫描以充分获得全局上下文信息,同时利用全卷积结构对图像的局部上下文信息进行抽取。在上下文信息的聚合方面,利用残差结构结合编码解码网络,提出了先捕获全局信息,在此基...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
某网站的检索结果5
哈尔滨工业大学工学硕士学位论文-36-图4-4图像主体示例(图源自网络7)两段式的图像检索模型意在将这种注意力强化,本文的视觉显著性检测模型因使用了捕获信息能力更全面的注意力提取方法,并对全局注意力和局部注意力进行了有效的结合,所以可以得到突出图像主体目标的一个结果。若以图4-4为例,则可以得到一匹马的掩码图。紧接着,图像特征提取模型可以对显著性检测模型提出的结果进行进一步的凝练和升华,即利用图中马的掩码图得到图中主体,通过这个主体来进行特征抽取,获得图像主体的特征。届时,图中主体目标就被转化成一个表示能力强、易于检索的特征向量。4.3.1两段式图像检索模型的整体框架此两段式模型的第一阶段就是利用显著性检测模型将原始图像中的主体目标抽出,本文使用的显著性检测方法借助残差结构将局部上下文与全局上下文信息进行了有效的结合,在此基础上生成了一个包含了主体目标位置的掩码图像。接下来就需要把第一阶段的结果充分利用起来,使用后处理手段来将原始图像的主体目标获得。在本文的第二阶段,将后处理得到的主体图像作为特征抽取模型的输入。首先,使用一个卷积神经网络进行特征抽取,对此网络得到的结果进行GeM池化,最终获得一个用于检索特征向量。对所有原始图像库中图像进行上述两段式的操作,均可得到一个对应的检索向量,把所有检索向量存入检索库中。对任一输入图像,使用一样的方法方法得7http://veconcyf.blog.163.com/blog/static/1269920322010026112758658/
图4-5两段
【参考文献】:
期刊论文
[1]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
本文编号:3445776
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
某网站的检索结果5
哈尔滨工业大学工学硕士学位论文-36-图4-4图像主体示例(图源自网络7)两段式的图像检索模型意在将这种注意力强化,本文的视觉显著性检测模型因使用了捕获信息能力更全面的注意力提取方法,并对全局注意力和局部注意力进行了有效的结合,所以可以得到突出图像主体目标的一个结果。若以图4-4为例,则可以得到一匹马的掩码图。紧接着,图像特征提取模型可以对显著性检测模型提出的结果进行进一步的凝练和升华,即利用图中马的掩码图得到图中主体,通过这个主体来进行特征抽取,获得图像主体的特征。届时,图中主体目标就被转化成一个表示能力强、易于检索的特征向量。4.3.1两段式图像检索模型的整体框架此两段式模型的第一阶段就是利用显著性检测模型将原始图像中的主体目标抽出,本文使用的显著性检测方法借助残差结构将局部上下文与全局上下文信息进行了有效的结合,在此基础上生成了一个包含了主体目标位置的掩码图像。接下来就需要把第一阶段的结果充分利用起来,使用后处理手段来将原始图像的主体目标获得。在本文的第二阶段,将后处理得到的主体图像作为特征抽取模型的输入。首先,使用一个卷积神经网络进行特征抽取,对此网络得到的结果进行GeM池化,最终获得一个用于检索特征向量。对所有原始图像库中图像进行上述两段式的操作,均可得到一个对应的检索向量,把所有检索向量存入检索库中。对任一输入图像,使用一样的方法方法得7http://veconcyf.blog.163.com/blog/static/1269920322010026112758658/
图4-5两段
【参考文献】:
期刊论文
[1]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
本文编号:3445776
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3445776.html
最近更新
教材专著