小样本条件下的遥感图像检索方法研究
发布时间:2021-03-01 18:42
遥感图像检索是图像检索的重要领域,也是计算机理解图像的重要应用,可用于地标检索、环境监测、城市规划、灾害管理等。为了充分利用遥感图像,迫切需要有效的信息管理,挖掘和解释方法。自ImageNet图像分类大赛2012年的冠军AlexNet诞生以来,以卷积神经网络(Convolutional Neural Network,CNN)为主的新一代基于内容的遥感图像检索技术也大幅度提高了检索任务的准确率,其中有代表性的工作如R-MAC、VLAD-CNN、Neural Codes、Deep Retrieval等。受制于现实世界中获取标注数据的巨大成本,一些新兴的研究领域也逐渐被提出:计算机视觉中的小样本学习,当属最有希望解决这个问题的理论方向。与此同时,在遥感图像检索的现实应用中正好存在大量的无标注图像。因而,本文致力于研究遥感图像检索领域中的小样本学习问题。本文的研究目标即是:如何充分利用库内已有的历史遥感图片,只借助新类别图像中的少量样本标签信息,从而在极少的人工标注下添加新的检索类别,实现有效的新任务检索,并尽量不影响旧类别的检索效果。在此同时,还需要考虑模型的计算成本,避免大开销的额外模型训...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
遥感图像检索系统示意图
浙江大学硕士学位论文第1章绪论2小样本学习的想法来自于模仿人类可以通过极少量的样本识别一类新物体的能力。比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是小样本学习要解决的问题。因为目前大部分小样本学习的研究集中于小样本图像分类领域,我们这里通过小样本图像分类的例子来介绍小样本学习任务。图1.2小样本图像分类问题示意图一个具体的小样本分类任务通常被称为N-wayK-shot问题,即要求模型从N×K个已标注数据中学会如何区分这N个类别。如图1.2所示,在一个N-wayK-shot问题中,模型的训练集会包含很多的类别,其类别数量记为M。在模型训练完成之后,在全新的N个类别上会给出支持集和测试集两个数据集。其中支持集包含N个类别,每个类别K个已标注样本(总共N×K个数据)。通过快速适配支持集中已标注的N×K个数据,模型需要对测试集中这N个新类别的大量无标注图像进行正确的分类。
浙江大学硕士学位论文第1章绪论4少的专家知识有效地标注遥感图像,使其完成新任务下的检索功能,是一个重要且不可避免的问题。二、重新训练模型开销大,不稳定。对于每次新类型图像的入库,模型需要对库中图像进行重新训练并重新进行特征抽取,这会带来训练时间长,资源占用多的问题,不利于数据库中图像类别的扩展。因此,如何泛化模型,同时尽量减少额外的训练,也是我们需要考虑的问题。图1.3研究目标示意图针对上述情况带来的问题,本文研究的是如何充分利用库内已有的历史遥感图片,只借助新类别图像中的少量样本标签信息,从而在极少的人工标注下添加新的检索类别,实现有效的新任务检索。在此同时,还需要提高模型的泛化能力,避免额外训练模型的巨大开销。本文研究的遥感图像检索的小样本学习问题,因此新入库的图像数量可以是几千张、几百张,甚至几张或一张,其中只需要对每个类别标注极少量的图像(如5张,又或1张),而其他新增类别的图像可不带标签信息。
【参考文献】:
期刊论文
[1]空间特征在遥感影像分析中的应用[J]. 鲁学军,王钦敏,明冬萍,王晶,徐志刚. 中国图象图形学报. 2004(06)
硕士论文
[1]基于深度学习的遥感图像检索方法研究[D]. 刘雪莹.中国科学院大学(中国科学院遥感与数字地球研究所) 2017
本文编号:3057870
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
遥感图像检索系统示意图
浙江大学硕士学位论文第1章绪论2小样本学习的想法来自于模仿人类可以通过极少量的样本识别一类新物体的能力。比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是小样本学习要解决的问题。因为目前大部分小样本学习的研究集中于小样本图像分类领域,我们这里通过小样本图像分类的例子来介绍小样本学习任务。图1.2小样本图像分类问题示意图一个具体的小样本分类任务通常被称为N-wayK-shot问题,即要求模型从N×K个已标注数据中学会如何区分这N个类别。如图1.2所示,在一个N-wayK-shot问题中,模型的训练集会包含很多的类别,其类别数量记为M。在模型训练完成之后,在全新的N个类别上会给出支持集和测试集两个数据集。其中支持集包含N个类别,每个类别K个已标注样本(总共N×K个数据)。通过快速适配支持集中已标注的N×K个数据,模型需要对测试集中这N个新类别的大量无标注图像进行正确的分类。
浙江大学硕士学位论文第1章绪论4少的专家知识有效地标注遥感图像,使其完成新任务下的检索功能,是一个重要且不可避免的问题。二、重新训练模型开销大,不稳定。对于每次新类型图像的入库,模型需要对库中图像进行重新训练并重新进行特征抽取,这会带来训练时间长,资源占用多的问题,不利于数据库中图像类别的扩展。因此,如何泛化模型,同时尽量减少额外的训练,也是我们需要考虑的问题。图1.3研究目标示意图针对上述情况带来的问题,本文研究的是如何充分利用库内已有的历史遥感图片,只借助新类别图像中的少量样本标签信息,从而在极少的人工标注下添加新的检索类别,实现有效的新任务检索。在此同时,还需要提高模型的泛化能力,避免额外训练模型的巨大开销。本文研究的遥感图像检索的小样本学习问题,因此新入库的图像数量可以是几千张、几百张,甚至几张或一张,其中只需要对每个类别标注极少量的图像(如5张,又或1张),而其他新增类别的图像可不带标签信息。
【参考文献】:
期刊论文
[1]空间特征在遥感影像分析中的应用[J]. 鲁学军,王钦敏,明冬萍,王晶,徐志刚. 中国图象图形学报. 2004(06)
硕士论文
[1]基于深度学习的遥感图像检索方法研究[D]. 刘雪莹.中国科学院大学(中国科学院遥感与数字地球研究所) 2017
本文编号:3057870
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3057870.html