基于深度学习和稀疏表示的图像分类与检索方法研究
发布时间:2021-12-16 04:02
图像分类和图像检索技术是当前计算机科学飞速发展和数字图像资源爆发式增长形势下智能信息处理领域研究的热点问题。如何对图像内容进行有效的表示是图像分类和图像检索技术中一个关键问题。目前,在图像分类与图像检索技术中,特征描述是图像表示的主要形式,存在着高维度与复杂性等问题。图像的稀疏表示模型作为一种新兴的特征表示方法,能够有效解决实际应用中所存在的存储量、计算复杂度与图像解译性等方面的问题。此外,深度学习技术的出现使得图像特征提取不再依赖于受人为主观因素影响的人工设计方法,而是着眼于通过大量数据来发掘数据中所隐含的深层次关系,使得图像特征的描述能力得到进一步的提升。本文主要针对图像分类和图像检索中图像特征表示问题,研究了基于稀疏表示的图像表示方法和基于层次化特征提取的深度学习模型,以达到提升图像分类与检索性能的目的。本文的主要工作包括:(1)提出一种基于稀疏表示和特征融合的图像检索方法:针对目前图像局部特征表达所存在的高维度与复杂性等问题,以“稀疏编码”为核心,通过字典学习、系数学习、特征池化等一系列操作,构建了基于稀疏表示的稀疏特征学习模型,所获得的特征描述相较于局部特征更具稀疏性与可区分...
【文章来源】:西安理工大学陕西省
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
数字图像资源的部分应用
形式来表示图像信息。在早期的 CBIR 和 CBIC 技术中得的情况下,比如不同的成像条件(光照变化、红外热成像目标存在遮挡或部分遮挡、目标与背景交错杂乱等情况,像分类等应用的鲁棒性较差,因而效果并不理想,并且随,准确率反而呈现一种下降的趋势。一些能够表述图像主要内容信息的像素信息,即目标像程中,图像中各个部分所对应的像素内容对表达图像内容性的。如图 2-2 所示,在一般的 CBIR 和 CBIC 任务中,要性上比 B 背景区域像素内容要高。相比较于图像的全-2 中山羊的胡须、耳朵、身子以及尾巴等等局部所具有目标位置变化、或存在部分遮挡等情况下,其部分特征仍好的可区分性。因此,图像的局部特征可以在特定情况下
(a)背景信息 (b)前景目标图 2-12 图像低秩性分析图示Fig.2-12 Schematic diagram of image low rank analysisb.稀疏表示(SR)Olshausen 和 Field 等人[53][54]在《Nature》上发表的论文证实了自然图像本身存在着稀疏性这一特性。对于图像来说,本身就是一种二维信号,根据图像的稀疏性和信号的稀疏表示(Sparse representation)理论,研究学者们提出了一种新的图像表示方法 图像过完备稀疏表示μ(SR 模型将于本文第三章进行详细介绍)。首先,通过对图像进行重叠块采样,获取到用以描述图像局部的块特征,以此作为数据源,通过字典学习的方法构建过完备词典,即得到用于描述图像局部特征的基原子的集合。如果构造的字典符合人类视觉系统的特性,则图像过完备稀疏表示模型便能够获得更为稀疏的图像表示。周培诚,韩军伟等人[55]将图像过完备稀疏表示理论应用在了遥感图像检索方向上,通过训练图像构建超完备视觉词典对待测试的图像进行过完备稀疏表示,最后通过查询图像与测试图像的重构误差,采用基于投票策略的相似性度量方法实现了图像检索。Wright 等人[56]采用图像过完备稀疏表示模型进行人脸识别应用,首先通过训练图像构建过完备词典并对待测试的图像
本文编号:3537441
【文章来源】:西安理工大学陕西省
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
数字图像资源的部分应用
形式来表示图像信息。在早期的 CBIR 和 CBIC 技术中得的情况下,比如不同的成像条件(光照变化、红外热成像目标存在遮挡或部分遮挡、目标与背景交错杂乱等情况,像分类等应用的鲁棒性较差,因而效果并不理想,并且随,准确率反而呈现一种下降的趋势。一些能够表述图像主要内容信息的像素信息,即目标像程中,图像中各个部分所对应的像素内容对表达图像内容性的。如图 2-2 所示,在一般的 CBIR 和 CBIC 任务中,要性上比 B 背景区域像素内容要高。相比较于图像的全-2 中山羊的胡须、耳朵、身子以及尾巴等等局部所具有目标位置变化、或存在部分遮挡等情况下,其部分特征仍好的可区分性。因此,图像的局部特征可以在特定情况下
(a)背景信息 (b)前景目标图 2-12 图像低秩性分析图示Fig.2-12 Schematic diagram of image low rank analysisb.稀疏表示(SR)Olshausen 和 Field 等人[53][54]在《Nature》上发表的论文证实了自然图像本身存在着稀疏性这一特性。对于图像来说,本身就是一种二维信号,根据图像的稀疏性和信号的稀疏表示(Sparse representation)理论,研究学者们提出了一种新的图像表示方法 图像过完备稀疏表示μ(SR 模型将于本文第三章进行详细介绍)。首先,通过对图像进行重叠块采样,获取到用以描述图像局部的块特征,以此作为数据源,通过字典学习的方法构建过完备词典,即得到用于描述图像局部特征的基原子的集合。如果构造的字典符合人类视觉系统的特性,则图像过完备稀疏表示模型便能够获得更为稀疏的图像表示。周培诚,韩军伟等人[55]将图像过完备稀疏表示理论应用在了遥感图像检索方向上,通过训练图像构建超完备视觉词典对待测试的图像进行过完备稀疏表示,最后通过查询图像与测试图像的重构误差,采用基于投票策略的相似性度量方法实现了图像检索。Wright 等人[56]采用图像过完备稀疏表示模型进行人脸识别应用,首先通过训练图像构建过完备词典并对待测试的图像
本文编号:3537441
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3537441.html