基于深度学习的图像检索
发布时间:2017-05-21 14:07
本文关键词:基于深度学习的图像检索,由笔耕文化传播整理发布。
【摘要】:随着图像处理的信息量越来越大,基于文本的图像检索已越来越不合时宜。对此,研究者逐渐将研究的重心转向基于内容的图像检索,各种基于内容的图像检索算法也因此迅速兴起。而有效地表示图像内容对于大规模基于内容的图像检索而言,是一项意义重大的任务。由于二进制哈希码的计算和存储效率都比较高,二进制哈希算法已经引起了广泛的关注,但是同时提取SIFT描述子时,会降低算法的计算速度。这其中,深度学习作为目前机器学习研究中最火的一项技术,它可以通过建立模型让模型自己直接学习图片的特征,这样大大降低了因人工提取图片特征而产生的误差。而深度学习中的卷积神经网络由于其相对简单高效,提取的特征比传统的特征提取算法更为精确,因此成为了目前最常用的一项技术。卷积神经网络在图像检索方面已经取得了重大突破。卷积神经网络(CNN)的使用不仅可以让模型通过隐藏层学习到训练样本数据的二进制表示,而且可以让模型学习到图像的表示。首先,本文提出了一个简单但是高效的深度学习网络模型卷积神经网络,用此网络模型可生成二进制哈希编码,并以此进行快速的图像检索。另外,通过在深度卷积神经网络模型中添加一个隐藏属性,使得这个网络模型不仅能用领域相关的图像表示,而且可以去学习一系列的哈希函数。我们知道,大部分的监督学习算法为了学习到图像的二进制表示,一般都需要两张图片作为输入,而本文的深度学习方法则是通过一张图片作为输入来学习图像的二进制编码和图像表示,这样大大减少了计算量和存储空间。因此,本文提出的深度学习二进制哈希检索时,其检索速率很高,但是检索精度会有所降低;用浮点性特征做图像检索时,其检索精度高,但是计算量庞大,其检索速率十分低下。针对这一问题,本文提出了一种综合的由粗到精的检索方法,先利用二进制特征初步检索出与查询图片相似的图片,由于一个二进制编码可以对应很多不同标签的图片,因此,利用二进制特征检索出来的图片中有很多干扰图片,这一步是粗水平的检索。当我们再利用浮点型特征进一步剔除干扰图片,这一步是精细水平上的检索。这样不但保证了图像检索的精度,而且提高了图像检索的速度。在不同大小的数据集上,我们进行了三类实验:基于MNIST数据集的模型测试、基于CIFAR-10数据集的模型测试、基于Yahoo-1M数据集的模型测试。从这三类实验可得出以下结论:随着数据集的增大,本文提出的CNN模型相比于之前的模型仍能保持着高效稳定的性能,这进一步表明本文提出的模型适合大规模的图像检索。
【关键词】:图像检索 SIFT描述子 深度学习 CNN 哈希
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-15
- 1.1 课题研究的背景10-12
- 1.2 国内外研究的现状12-13
- 1.3 本文的组织结构13-15
- 第2章 相关技术概述15-25
- 2.1 深度学习16-19
- 2.1.1 深度学习的定义16
- 2.1.2 深度学习的优势16-19
- 2.1.3 深度学习的基本思想19
- 2.2 受限玻尔兹曼机(RBM)19-20
- 2.3 特征提取算法20-24
- 2.3.1 高区分性局部特征算法20-21
- 2.3.2 使用哈希映射的二进制特征21-22
- 2.3.3 直接提取二进制特征22-23
- 2.3.4 二进制特征检索模型的改进23-24
- 2.3.5 搜索后的几何验证24
- 2.4 小结24-25
- 第3章 基于拉普拉斯特征映射的多核卷积神经网络25-40
- 3.1 CAFFE开发工具26-27
- 3.1.1 Caffe的网络定义26
- 3.1.2 Caffe的各层的定义26-27
- 3.2 卷积神经网络(CNN)27-29
- 3.3 多核卷积神经网络的建立29-31
- 3.3.1 学习二进制哈希编码30
- 3.3.2 图像检索30-31
- 3.4 卷积层的参数训练过程31-33
- 3.5 子采样层的训练过程33-34
- 3.6 拉普拉斯特征映射降维34-37
- 3.7 算法的流程37-38
- 3.8 本章小结38-40
- 第4章 模型测试与数据分析40-50
- 4.1 数据集40-41
- 4.2 评估标准41
- 4.3 基于MNIST数据集的模型测试41-43
- 4.4 基于CIFAR-10数据集的模型测试43-46
- 4.5 基于YAHOO-1M数据集的模型测试46-48
- 4.6 本章小节48-50
- 第5章 总结与展望50-53
- 5.1 总结50-51
- 5.2 展望51-53
- 参考文献53-56
- 作者简介及在学校期间所取得的科研成果56-57
- 致谢57
【参考文献】
中国期刊全文数据库 前1条
1 孙玉宝;肖亮;韦志辉;邵文泽;;基于Gabor感知多成份字典的图像稀疏表示算法研究[J];自动化学报;2008年11期
中国博士学位论文全文数据库 前2条
1 孙君顶;基于内容的图像检索技术研究[D];西安电子科技大学;2005年
2 夏定元;基于内容的图像检索通用技术研究及应用[D];华中科技大学;2004年
中国硕士学位论文全文数据库 前3条
1 陈硕;深度学习神经网络在语音识别中的应用研究[D];华南理工大学;2013年
2 林妙真;基于深度学习的人脸识别研究[D];大连理工大学;2013年
3 谢文兰;基于BP神经网络的语义风景图像检索技术的研究[D];湘潭大学;2009年
本文关键词:基于深度学习的图像检索,,由笔耕文化传播整理发布。
本文编号:383883
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/383883.html