基于上下文感知的高分辨率遥感影像目标检测
发布时间:2020-04-23 19:02
【摘要】:随着航空航天技术的发展,遥感影像分辨率不断提高,遥感影像目标识别在很多领域,诸如国防安全、交通监测、城市管理、智能视频监控、机器人导航和增强现实等都有广泛的应用。作为视觉领域的基础研究课题之一,目标检测是很多高级视觉任务的基础和前提,但总体来看依然受制于以下三个因素:图像质量不高,目标本身尺寸过小以及检测方法不完善等。图像质量不佳是由于遥感图像在成像过程中容易受到光照、云、雾、海浪等自然环境的影响导致的,同时一些目标由于自身尺度过小及周边噪声的干扰进一步增加了目标检测的难度。因此如何快速、准确的从大量复杂的场景中提取感兴趣的目标和信息具有非常重要的意义。丰富的地物表达是目标检测的关键,因此本文基于上下文思想提出了一种基于上下文感知的高分辨率遥感影像目标检测方法。该方法主要包括三个过程:尺度上下文提取,空间上下文提取及特征融合,本文首先对尺度上下文和空间上下文分别进行研究,通过实验分析他们对目标检测的贡献和影响,最后在进行特征融合时,设计了一种更加有效的特征融合方式,结果表明本文提出的上下文融合方法能够显著提高目标的检测精度,相比于常规的目标检测方法具有更准确的效果。文章主要包括以下内容:(1)对基于尺度上下文的遥感影像目标检测方法进行了研究。本文基于深度学习进行尺度上下文提取,针对卷积造成的细节丢失问题,考虑在多个尺度上学习目标的特征表示,融合成尺度上下文用于目标检测。首先在不同层级的特征图上进行特征提取,通过实验比较不同层级特征对目标检测的影响。然后进一步将提取到的不同尺度的特征进行融合,以弥补低层特征与高层特征之间的语义鸿沟,提高目标检测的精度。(2)对基于空间上下文的遥感影像目标检测方法进行了研究。物体总是出现在特定的场景中,目标与周边环境的内在联系能够有效降低目标检测的不确定性,提高检测的精度。因此本文重点研究了空间上下文对目标检测的贡献及影响,通过对不同范围大小的空间上下文对目标检测的影响进行实验和分析,最终提出一种有效的空间上下文融合方法。结果表明,空间上下文的融合有助于检测精度的提高。(3)对上下文特征的融合方法进行了研究。在前面研究的基础上,本文将尺度上下文和空间上下文进行融合,联合用于目标检测,并针对上下文特征融合提出了一种新的更有效的特征融合方法,结果证明改进后的特征融合方法进一步提高了目标检测的精度。本文致力于提高高分辨率目标检测的精度,通过对特征表达及融合进行研究,提出了基于上下文感知的高分辨率遥感影像目标检测方法,实验结果表明,这种方法能够有效提升目标检测的精度,也为上下文的发展提供借鉴和思路。
【图文】:
检测提供新的方法和借鉴。逡逑1.3.2技术路线逡逑图1-2给出了本文基于上下文感知的遥感影像目标检测的总体框架,主要包括尺逡逑度上下文、空间上下文及上下文特征融合三部分。逡逑卷积逦^卖选框生^逦邋逦邋逦逦—分类逡逑入计算灶什阳成网络候选框逦上下文候逦上下文特」今沐垃_邋逦逡逑图逦*特征图逦生成逦J选框生成逦征融合逦接逦逦逡逑L邋|逦逦邋H邋到立,逡逑r---l逦■fk--]逡逑丨尺度上下逦空间上下[_逡逑j文提取逦文提取I逡逑丨1_.二逦邋邋h逡逑图1-2基于上下文感知的高分辨率遥感影像目标
下减小数据量。这三个操作都起到了降低模型参数复杂度的作用。逡逑同时,卷积神经网络将卷积和池化操作交叠进行,通过不断的对图像特征进行抽逡逑象,,从而得到更高级的语义信息。图2-2是经典的卷积神经网络模型LeNet-5,只由逡逑卷积、池化和全连接构成。对于一幅32*32的输入图像,如果采用5*5的卷积核,逡逑那么输入层到第一个隐藏层的每个节点只需要训练25个参数,在卷积核步长为1个逡逑像素的情况下,第一个隐藏层的输出为28*28个节点,倘若权值不共享,总的训练逡逑参数将是28*28*25,如果拓展成1000*1000*3的图像或者,参数将是996*996*75,逡逑训练参数会非常庞大,因此卷积神经网络采用权值共享的方式,让上一级到下一级逡逑所有节点共享同一套卷积参数,因此该层卷积只需要训练25个参数即可。卷积神经逡逑网络相比于BP神经网络,卷积神经网络参数更少,更加易于训练和提取抽象特征。逡逑除此之外
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP751
本文编号:2638046
【图文】:
检测提供新的方法和借鉴。逡逑1.3.2技术路线逡逑图1-2给出了本文基于上下文感知的遥感影像目标检测的总体框架,主要包括尺逡逑度上下文、空间上下文及上下文特征融合三部分。逡逑卷积逦^卖选框生^逦邋逦邋逦逦—分类逡逑入计算灶什阳成网络候选框逦上下文候逦上下文特」今沐垃_邋逦逡逑图逦*特征图逦生成逦J选框生成逦征融合逦接逦逦逡逑L邋|逦逦邋H邋到立,逡逑r---l逦■fk--]逡逑丨尺度上下逦空间上下[_逡逑j文提取逦文提取I逡逑丨1_.二逦邋邋h逡逑图1-2基于上下文感知的高分辨率遥感影像目标
下减小数据量。这三个操作都起到了降低模型参数复杂度的作用。逡逑同时,卷积神经网络将卷积和池化操作交叠进行,通过不断的对图像特征进行抽逡逑象,,从而得到更高级的语义信息。图2-2是经典的卷积神经网络模型LeNet-5,只由逡逑卷积、池化和全连接构成。对于一幅32*32的输入图像,如果采用5*5的卷积核,逡逑那么输入层到第一个隐藏层的每个节点只需要训练25个参数,在卷积核步长为1个逡逑像素的情况下,第一个隐藏层的输出为28*28个节点,倘若权值不共享,总的训练逡逑参数将是28*28*25,如果拓展成1000*1000*3的图像或者,参数将是996*996*75,逡逑训练参数会非常庞大,因此卷积神经网络采用权值共享的方式,让上一级到下一级逡逑所有节点共享同一套卷积参数,因此该层卷积只需要训练25个参数即可。卷积神经逡逑网络相比于BP神经网络,卷积神经网络参数更少,更加易于训练和提取抽象特征。逡逑除此之外
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP751
【参考文献】
相关期刊论文 前4条
1 李德仁;张良培;夏桂松;;遥感大数据自动分析与数据挖掘[J];测绘学报;2014年12期
2 高常鑫;桑农;;基于深度学习的高分辨率遥感影像目标检测[J];测绘通报;2014年S1期
3 刘丽;匡纲要;;图像纹理特征提取方法综述[J];中国图象图形学报;2009年04期
4 付玮;曾接贤;;基于形状特征的图像检索技术研究[J];计算机技术与发展;2007年11期
本文编号:2638046
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/2638046.html