引入视觉显著机制的图像检索架构研究
发布时间:2022-01-13 19:52
随着互联网的不断发展,多媒体信息在网络上日益增多。图像作为一个重要的多媒体信息元素,更是与人们的生活密切相关。网络上每时每刻都有着成千上万的数据量上传与下载,那么,如何在一个巨大的数据库中进行媒体数据的搜索一直是一个重要的课题。基于内容的图像搜索技术从图像内容出发,提取图像的关键信息再进行相似性度量以此来搜索到用户想要查询的相似图像。这种图像搜索方法比基于文本的图像检索方法更加的简单快捷,准确率高。但是,这种基于内容的图像检索方法需要充分地挖掘图像的内容信息,从而找到真正相似的图像,这就对图像内容理解有着很高的要求。视觉显著性作为一种人所关注的信息,能够挖掘图像的重要信息。本文主要将视觉显著性信息引入到图像检索架构中,主要研究工作包括:(1)嵌入训练视觉显著性的CNN架构研究。本文提出了一种嵌入训练视觉显著性的CNN架构,将DeepFixNet模型与VGG模型相结合,在DeepFixNet模型的第八层之后添加新的卷积层以此来训练出适用于图像搜索任务的显著图信息,与VGG模型相结合嵌入训练的显著性信息。在六种经典的数据集上进行实验验证,得到了嵌入的显著性信息的有效性。在泛化实验中,利用模...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图2-1词包模型架构??Figure?2-1?Bag?of?word?framework??
'64??图2-2VGG-16网络模型??Figure?2-2?VGG-16?framework??2.3.1卷积层??卷积层是CNN中一个重要的层,就是利用卷积核来对图像进行卷积求和的过??程,以此来得到图像的全局特征等信息,这也是在模拟人脑思考感知机制的一个仿??真过程。整个卷积层的计算过程如图2-3所示。??假设图2-3最左边的4X4矩阵是一幅特征图,卷积的过程中,首先进行补零??操作,对4X4的矩阵四周进行补零,形成6X6的矩阵,再利用图2-3中3X3的??卷积核(里面的数值就是CNN中常说的权重参数)来进行卷积操作,将3X3的模板??与特征图中3X3的子块进行匹配,相应进行相乘相加的操作,得到一个数字作为??新的特征图左上角的第一个数字,然后模板进行滑动,按照上述过程进行卷积,最??终得到新的特征图。??0?I?0?1?0?1?0?I?0?1?0??1?h?[2?IT]?Z工工I工A?mi丨1丨1丨2丨4??AA?AA?上土丄土I]区替?丁T?_?I了了I??丄丄丄_1丄丁反土_1?___?—i?YTTT??4?I?3?[?I?5?I?"〇 ̄?4?3?[?1?5?0???^??0?I?0?I?0?I?0?I?0?[?0?I??图2-3卷积层过程??Figure?2-3?Convolutional?layer??卷积层操作能够得到图像中的一些特定信息
卷积层是CNN中一个重要的层,就是利用卷积核来对图像进行卷积求和的过??程,以此来得到图像的全局特征等信息,这也是在模拟人脑思考感知机制的一个仿??真过程。整个卷积层的计算过程如图2-3所示。??假设图2-3最左边的4X4矩阵是一幅特征图,卷积的过程中,首先进行补零??操作,对4X4的矩阵四周进行补零,形成6X6的矩阵,再利用图2-3中3X3的??卷积核(里面的数值就是CNN中常说的权重参数)来进行卷积操作,将3X3的模板??与特征图中3X3的子块进行匹配,相应进行相乘相加的操作,得到一个数字作为??新的特征图左上角的第一个数字,然后模板进行滑动,按照上述过程进行卷积,最??终得到新的特征图。??0?I?0?1?0?1?0?I?0?1?0??1?h?[2?IT]?Z工工I工A?mi丨1丨1丨2丨4??AA?AA?上土丄土I]区替?丁T?_?I了了I??丄丄丄_1丄丁反土_1?___?—i?YTTT??4?I?3?[?I?5?I?"〇 ̄?4?3?[?1?5?0???^??0?I?0?I?0?I?0?I?0?[?0?I??图2-3卷积层过程??Figure?2-3?Convolutional?layer??卷积层操作能够得到图像中的一些特定信息,比如:颜色、纹理、轮廓等。CNN??中含有多种卷积层,不同卷积层含有不同的卷积核参数,包括卷积核的大小、不同??特征值等等信息。不同的卷积核能够得到不同的图像信息
【参考文献】:
期刊论文
[1]量化SIFT和同态加密的隐私保护图像检索方法[J]. 陈帆. 传感器与微系统. 2017(05)
[2]基于相似图片聚类的Web文本特征算法[J]. 方爽,殷俊杰,徐武平. 计算机工程. 2014(12)
[3]基于主色提取和主色集扩充的图像检索算法[J]. 李丽丽,孙劲光. 计算机应用与软件. 2012(01)
[4]基于XML文本片段的图像检索实现与评价[J]. 陆伟,张宓,刘丹. 中国图书馆学报. 2009(02)
[5]一种基于主颜色表的图像检索算法[J]. 刘相滨,邹北骥. 湖南大学学报(自然科学版). 2001(01)
本文编号:3587047
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图2-1词包模型架构??Figure?2-1?Bag?of?word?framework??
'64??图2-2VGG-16网络模型??Figure?2-2?VGG-16?framework??2.3.1卷积层??卷积层是CNN中一个重要的层,就是利用卷积核来对图像进行卷积求和的过??程,以此来得到图像的全局特征等信息,这也是在模拟人脑思考感知机制的一个仿??真过程。整个卷积层的计算过程如图2-3所示。??假设图2-3最左边的4X4矩阵是一幅特征图,卷积的过程中,首先进行补零??操作,对4X4的矩阵四周进行补零,形成6X6的矩阵,再利用图2-3中3X3的??卷积核(里面的数值就是CNN中常说的权重参数)来进行卷积操作,将3X3的模板??与特征图中3X3的子块进行匹配,相应进行相乘相加的操作,得到一个数字作为??新的特征图左上角的第一个数字,然后模板进行滑动,按照上述过程进行卷积,最??终得到新的特征图。??0?I?0?1?0?1?0?I?0?1?0??1?h?[2?IT]?Z工工I工A?mi丨1丨1丨2丨4??AA?AA?上土丄土I]区替?丁T?_?I了了I??丄丄丄_1丄丁反土_1?___?—i?YTTT??4?I?3?[?I?5?I?"〇 ̄?4?3?[?1?5?0???^??0?I?0?I?0?I?0?I?0?[?0?I??图2-3卷积层过程??Figure?2-3?Convolutional?layer??卷积层操作能够得到图像中的一些特定信息
卷积层是CNN中一个重要的层,就是利用卷积核来对图像进行卷积求和的过??程,以此来得到图像的全局特征等信息,这也是在模拟人脑思考感知机制的一个仿??真过程。整个卷积层的计算过程如图2-3所示。??假设图2-3最左边的4X4矩阵是一幅特征图,卷积的过程中,首先进行补零??操作,对4X4的矩阵四周进行补零,形成6X6的矩阵,再利用图2-3中3X3的??卷积核(里面的数值就是CNN中常说的权重参数)来进行卷积操作,将3X3的模板??与特征图中3X3的子块进行匹配,相应进行相乘相加的操作,得到一个数字作为??新的特征图左上角的第一个数字,然后模板进行滑动,按照上述过程进行卷积,最??终得到新的特征图。??0?I?0?1?0?1?0?I?0?1?0??1?h?[2?IT]?Z工工I工A?mi丨1丨1丨2丨4??AA?AA?上土丄土I]区替?丁T?_?I了了I??丄丄丄_1丄丁反土_1?___?—i?YTTT??4?I?3?[?I?5?I?"〇 ̄?4?3?[?1?5?0???^??0?I?0?I?0?I?0?I?0?[?0?I??图2-3卷积层过程??Figure?2-3?Convolutional?layer??卷积层操作能够得到图像中的一些特定信息,比如:颜色、纹理、轮廓等。CNN??中含有多种卷积层,不同卷积层含有不同的卷积核参数,包括卷积核的大小、不同??特征值等等信息。不同的卷积核能够得到不同的图像信息
【参考文献】:
期刊论文
[1]量化SIFT和同态加密的隐私保护图像检索方法[J]. 陈帆. 传感器与微系统. 2017(05)
[2]基于相似图片聚类的Web文本特征算法[J]. 方爽,殷俊杰,徐武平. 计算机工程. 2014(12)
[3]基于主色提取和主色集扩充的图像检索算法[J]. 李丽丽,孙劲光. 计算机应用与软件. 2012(01)
[4]基于XML文本片段的图像检索实现与评价[J]. 陆伟,张宓,刘丹. 中国图书馆学报. 2009(02)
[5]一种基于主颜色表的图像检索算法[J]. 刘相滨,邹北骥. 湖南大学学报(自然科学版). 2001(01)
本文编号:3587047
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3587047.html