当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习与哈希码的图像检索方法研究

发布时间:2020-05-31 10:32
【摘要】:随着网络和多媒体技术的发展,基于内容的图像检索(CBIR)作为一种精确、快速的检索方法越来越受到用户的欢迎。近年来,CBIR面临的主要问题是人工设计的底层特征难以描述人类所理解的图像语义信息,即“语义鸿沟”问题,以及如何快速、有效地从海量图像数据库中检索出相似图像。这两个问题对应的是CBIR的两个主要步骤,即图像特征提取以及基于图像特征的索引建立。本文的研究便是围绕这两个主要步骤展开的。(1)提出一种图像特征提取模块——基于非监督学习的SS-VGG16卷积神经网络,应用在图像特征提取阶段。该模块有三个创新点,解决了三个问题,即:VGG16模型参数量过大问题、VGG16网络只能输入固定大小图像的问题、监督学习不能基于无标签图像数据库进行训练的问题。本文对经典的卷积神经网络VGG16进行改进,提出的基于Squeeze Net思想的轻量化S-VGG16网络结构,旨在减少网络的参数量,更少的参数量代表更短的网络训练时间,同时意味着更快的图像特征提取速度。为了解决传统CNN不能提取任意大小图像的特征问题,本文使用空间金字塔池化(SPP)去代替S-VGG16网络中的最后一个最大池化层,得到SS-VGG16网络框架,使得网络能够接受任意大小的图像作为输入,因此无需进行图像拉伸、裁剪等预处理,避免了图像失真问题。考虑到对无标签数据集进行图像检索,本文提出无监督迁移学习对SS-VGG16框架进行训练。该方法利用相似图像数据的内在联系,使用图像特征均值作为训练目标。为证明提出的SS-VGG16网络结构的有效性,本文在MIT Places 365-Standard公共数据集上进行监督学习实验,使用Top-1和Top-5准确率作为评价标准,对比了本文提出的SS-VGG16与原始VGG16的图像检索性能,证明了SS-VGG16的有效性。为了证明本文提出的无标签无监督学习的有效性,使用Paris 6k、UKBench作为实验数据集,并分别以MAP、Top-4准确率作为评价标准,将本文提出的方法与近年来使用无监督学习方法进行比较,证明对SS-VGG16进行无监督训练在图像检索任务中的优越性。(2)提出一种基于深度特征、特征预降维、以及迭代量化编码的图像检索算法。在建立特征索引前,本文提出使用基于自编码器的特征预降维方法对数据进行非线性学习,以达到对特征进行预降维的目的。在建立特征索引阶段,本文提出使用迭代量化(ITQ)方法,对预降维后的SS-VGG16深度特征进行编码;ITQ方法不断逼近特征与设定比特数的哈希码之间的量化误差最小值,实现量化误差的最小化。本文使用查全率(Recall)、查准率(Precision)和平均精度均值(MAP)作为检索效果的评价指标,在Caltech256图像库上进行测试。实验结果表明,本文提出的图像检索算法性能要优于其他主流算法。
【图文】:

图像分类


研究认为人脑的神经元只能感受到小范围的视觉变化。因静止(Stationary)的特性,,即图像的一部分统计数据与其他部分相同。这像的一部分学习的功能也可以应用到图像的其他部分,因此每一个卷积的一个卷积核对图像进行特征学习。 模型训练过程如下,每个输入图像将通过一系列由卷积核组成的tion Layers)、激活函数、池化层和完全连接层(Fully Connected Layers, FtMax 函数对概率值介于 0 和 1 之间的对象进行分类。图 2-3[40]描述了由的 CNN 的结构,通过多个卷积层、池化层对图像数据进行分析,全连到包含语义信息的图像特征,全连接层最后连接到 Softmax 层,对图像这个过程称为前向传播(Forward Propagation, FP);而 CNN 的训练过程则化 SoftMax 层与标准答案(Ground Truth)的误差函数,并通过随机梯ic Gradient Descent )[41]等方法,将梯度方向等信息向前转播,进而每一权重进行更新,这个过程称为反向传播(Back Propagation)。

示意图,卷积,示意图,卷积核


的输出组合成该层的多通道矩阵输出,即二维特征图(Featu重能够辨别局部信息,当图像局部出现某种变化时,特征图一个通道堆叠所有卷积核形成的特征图的激活图便可以得到个矩阵,通常是 3x3(也可以是 7x7)。输入图像的矩阵表,以生成特征映射形成特征图。使用较小的卷积核可以减少算量,减少计算的复杂度。同时,较小卷积核反而能够学习的特性是识别特定对象所需要的图像特征的。例如,每种动络能够对它进行识别,而防止图像信息丢失的方法是拥有许征映射到特征图中的不同位置,较小卷积核能够保证特征图像的范围产生联系。现的卷积操作如图 2-4 所示:
【学位授予单位】:五邑大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP18

【相似文献】

相关期刊论文 前10条

1 陈涛;;基于多示例学习的图像检索方法[J];网络安全技术与应用;2019年04期

2 乐艺;;基于机器学习的大规模船舶图像检索机制[J];舰船科学技术;2019年18期

3 方恩亮;细胞分裂方式图像检索[J];中学生物教学;1996年02期

4 冀振燕;姚伟娜;皮怀雨;;个性化图像检索和推荐[J];北京邮电大学学报;2017年03期

5 何岩;;以计算机为基础的色彩图像检索方法与研究[J];计算机光盘软件与应用;2013年12期

6 陈雅芳;;基于颜色特征与纹理特征的图像检索[J];硅谷;2012年06期

7 张丽丽;刘昌余;;基于盲取证的医学图像检索及语义表达研究综述[J];电脑知识与技术;2012年22期

8 曹梅;;网络图像检索行为与心理研究[J];中国图书馆学报;2011年05期

9 崔文成;邵虹;;基于遗传算法的图像检索中特征权重自动调整[J];计算机工程与应用;2008年02期

10 聂桂军;周源;;图像检索研究进展[J];南京工业职业技术学院学报;2008年02期

相关会议论文 前10条

1 陈世亮;李战怀;闫剑锋;;一种基于本体描述的空间语义图像检索方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

2 王晗;滕鹏;梁玮;;使用稠密兴趣点包的非对称风景图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年

3 许天兵;;一种基于语义分类的图像检索方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年

4 周向东;张亮;张琪;刘莉;殷慷;施伯乐;;一种新的图像检索相关反馈方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

5 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

6 朱远清;李才伟;;一种基于前景与背景划分的区域图像检索方法及实现[A];第十三届全国图象图形学学术会议论文集[C];2006年

7 彭瑜;乔奇峰;魏昆娟;;基于多示例学习的图像检索方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 胡敬;武港山;;基于语义特征的风景图像检索[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

9 王云鹤;史淼晶;许超;;基于流形聚类的图像检索方法[A];第七届全国信号和智能信息处理与应用学术会议会刊[C];2013年

10 张世佳;黄鑫;王衡;汪国平;;一种基于综合区域比较的图像检索方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

相关重要报纸文章 前1条

1 ;图像检索新技术[N];中国知识产权报;2000年

相关博士学位论文 前10条

1 田星;动态环境下的图像检索问题研究[D];华南理工大学;2019年

2 周容;基于轮廓的图像检索研究[D];上海交通大学;2016年

3 李莹;图像检索中的特征表达与排序研究[D];大连理工大学;2019年

4 周菊香;图像检索中的特征表达和相似性度量方法研究[D];大连理工大学;2019年

5 刘若愚;图像检索中的特征学习和索引技术研究[D];北京交通大学;2019年

6 于来行;基于视觉注意模型的图像检索方法研究[D];大连理工大学;2018年

7 苏雯;语义分割及其在图像检索中的应用[D];中国科学技术大学;2018年

8 张宪林;基于草图的图像检索关键技术研究[D];北京邮电大学;2019年

9 李珂;基于草图的精细图像检索[D];北京邮电大学;2019年

10 苏琨;手指静脉图像检索与融合识别方法研究[D];山东大学;2019年

相关硕士学位论文 前10条

1 陆徐超;基于深度学习的视频图像检索的哈希方法研究[D];上海交通大学;2018年

2 陈卓翔;基于隐式相关反馈的无查询服装图像检索[D];上海交通大学;2018年

3 赵恒川;基于语义的交互式图像检索[D];电子科技大学;2019年

4 王标;用于大规模图像检索的哈希编码方法的研究[D];重庆邮电大学;2018年

5 王培雷;基于残差网络的多标签图像检索方法研究[D];桂林电子科技大学;2019年

6 王娟;基于社会化标签和显著性区域的深度学习图像检索方法[D];西北大学;2019年

7 叶青青;用卷积神经网络的多标签图像检索方法研究[D];重庆邮电大学;2018年

8 谢雯斐;基于哈希算法的图像检索研究[D];重庆邮电大学;2018年

9 陈建华;基于多特征融合与LSH的密文图像检索研究[D];中南林业科技大学;2019年

10 吕明;基于多特征编码的图像检索[D];河南大学;2019年



本文编号:2689718

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2689718.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户271d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com