基于深度学习的遥感图像地面目标检测算法研究
发布时间:2020-11-03 23:22
遥感图像地面目标检测在军事战争领域中不仅能帮助指挥员获得准确的战场信息,而且可以定位打击敌方目标,提供实时的目标信息等。在环境管理、区域规划、矿产资源探测等民用领域,同样有着广泛的应用。遥感图像中地面目标包括(车辆、飞机、建筑、桥梁等)类目标及道路类目标,针对第一类目标,因同一目标内部特征差异较大,检测算法缺乏良好的特征提取能力,针对第二类目标,受目标形态特征的限制,检测算法不能完整的提取目标轮廓。因此,如何能准确地从遥感图像中检测出感兴趣目标,并保证算法具有一定的推广能力是研究的关键。本文针对以上两类遥感图像地面目标的检测,开展了如下研究工作:(1)深入分析了遥感图像两类目标的区别以及相应特征提取的异同,相应目标检测的特点及难点,论述了目标检测中各类方法的优点及缺陷,选取了目标检测中评价指标。(2)针对飞机、车辆类目标,提出了基于集成残差网络的遥感图像地面目标检测方法,针对目标尺寸多变,旋转,背景复杂的问题,以Faster RCNN为基础网络,使用Kmeans++聚类算法设计目标参考框尺寸,选择更为复杂的残差网络作为基础特征提取网络,在网络中加入背景分类子网络帮助区分目标和背景,搭建了集成网络模型,实验证明了加入各个模块的有效性,检测精度达到了89%以上。(3)针对道路目标,提出了基于集成可变形池化与空洞卷积的全卷积网络的遥感图像地面目标检测方法,针对道路目标形态不一的问题,以FCN网络为基础网络,设计了可变形池化核提取道路目标特征,加入批量标准化层,用空洞卷积代替传统特征提取方式,使用通道特征分析模块进一步改善网络性能。实验证明了各模块加入均有利于道路目标检测精度的提高,检测精度达到了84%以上。
【学位单位】:中北大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP751;TP18
【部分图文】:
中北大学学位论文11a遥感飞机目标图像aRemotesensingaircrafttargetimageb普通飞机目标图像bOrdinaryaircrafttargetimage图2.1遥感图像与普通图像对比Figure2.1Comparisonofremotesensingimageandordinaryimage(2)目标尺度变化与旋转遥感图像由于成像时距离不一,相机分辨率有差异。成像后图像中目标尺寸会有一定的变化。拍摄范围广时图像中往往包含多个目标,目标存在一定的旋转。如图2.2所示,该图为飞机场上空拍摄的图像,针对飞机目标,图像中存在多种尺度的飞机,同类目标之间存在较大的尺度变化,此外,每个目标的摆设角度也不相同,存在一定的旋转问题。因此,遥感图像中地面目标尺度变化与旋转都容易导致目标特征变化,带来检测的困难。图2.2遥感图像目标旋转Figure2.2Remotesensingimagetargetrotation(3)图像背景复杂多变遥感图像由于用于探测地面信息,地面情况往往比较复杂,因此成像后的图像背景比较复杂。如果遥感图像地面目标检测算法不能准确的区分目标与背景,降低检测准确率。而遥感图像地面目标检测任务多变,拍摄位置覆盖城市,乡村,森林,海洋等不同
中北大学学位论文13行介绍。(1)基本结构介绍通过生物视觉感知的研究,CNN是通过模拟人类大脑神经元结构设计出的人工神经网络。CNN网络中包含输入层、卷积层、池化层、激励层和全连接层等结构,其中卷积层、池化层以及激励层是CNN网络的核心组成部分[31],卷积操作相当于滤波的过程,每一个卷积核都相当于一个滤波器,CNN中卷积层后会加入池化来降维,实现特征的降维,减小网络的参数量,常用的池化方式有最大值池化与均值池化,激励层通过非线性函数实现数据的非线性化,常见的有RELU,TAN等,用来给网络加入非线性能力,反向传播算法(Back-propagationAlgorithm,BP)则用来更新CNN网络中的参数。由于CNN网络独特的感受野机制,CNN具有旋转以及尺度不变性,在图像目标检测任务中能取得很好的效果。总体而言,CNN通过卷积,池化与非线性激活的一定组合可以实现对输入数据的抽象特征的提龋特征提取的过程属于前向传播的过程。在实现任务时,CNN会将任务量化为损失函数的形式。损失函数表示任务真实值与网络预测值之间的误差,之后,计算经过前向传播得到预测值与真实值之间的误差,通过BP算法将误差从网络最后一层向前反馈,以减小误差的方向对网络中参数进行更新。更新后再次通过前向传播,重复迭代,直至损失函数收敛到一定范围,模型训练完成[32]。图2.3LeNet网络结构Figure2.3LeNetnetworkstructure现代CNN网络结构可以追朔到1980年,研究员模拟人类视觉系统设计出了可以实现手写字符识别等任务的深层人工神经网络,这是CNN网络最早的前身。1998年专家提出了用于手写数字识别的卷积神经网络,LeNet。如图2.3所示。LeNet网络一共包括
中北大学学位论文143个卷积层以及3个全连接层,另外还有2个池化层。经过手写字符识别任务的验证,LeNet达到了99%的正确率,美国邮政系统识别邮政编码也采用了该网络结构。之后,在ImageNet图像分类大赛上获得第一名的AlexNet网络被提出,网络结构如图2.4所示。AlexNet网络共有5个卷积层,3个池化层以及3个全连接层[33]。图2.4AlexNet网络结构Figure2.4AlexNetnetworkstructure(2)卷积层卷积层是CNN网络重要的基本结构之一,卷积层主要功能是依靠卷积操作提取待检图像的特征。每层卷积层中都含有大量的卷积核,卷积核的数量及尺寸都可能影响CNN网络的性能。传统的全连接网络将每一个神经元全部连接,使得网络拥有大量的参数,难以训练,现代CNN网络通过卷积以局部连接和全局共享的形式,降低了网络的参数量和计算量,同时减少了出现过拟合的现象[34]。卷积操作的本质是滤波的过程,在CNN网络中以离散卷积的形式出现的,在图像目标检测过程中,应用最多的是二维卷积,相关操作如图2.5所示。
【参考文献】
本文编号:2869253
【学位单位】:中北大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP751;TP18
【部分图文】:
中北大学学位论文11a遥感飞机目标图像aRemotesensingaircrafttargetimageb普通飞机目标图像bOrdinaryaircrafttargetimage图2.1遥感图像与普通图像对比Figure2.1Comparisonofremotesensingimageandordinaryimage(2)目标尺度变化与旋转遥感图像由于成像时距离不一,相机分辨率有差异。成像后图像中目标尺寸会有一定的变化。拍摄范围广时图像中往往包含多个目标,目标存在一定的旋转。如图2.2所示,该图为飞机场上空拍摄的图像,针对飞机目标,图像中存在多种尺度的飞机,同类目标之间存在较大的尺度变化,此外,每个目标的摆设角度也不相同,存在一定的旋转问题。因此,遥感图像中地面目标尺度变化与旋转都容易导致目标特征变化,带来检测的困难。图2.2遥感图像目标旋转Figure2.2Remotesensingimagetargetrotation(3)图像背景复杂多变遥感图像由于用于探测地面信息,地面情况往往比较复杂,因此成像后的图像背景比较复杂。如果遥感图像地面目标检测算法不能准确的区分目标与背景,降低检测准确率。而遥感图像地面目标检测任务多变,拍摄位置覆盖城市,乡村,森林,海洋等不同
中北大学学位论文13行介绍。(1)基本结构介绍通过生物视觉感知的研究,CNN是通过模拟人类大脑神经元结构设计出的人工神经网络。CNN网络中包含输入层、卷积层、池化层、激励层和全连接层等结构,其中卷积层、池化层以及激励层是CNN网络的核心组成部分[31],卷积操作相当于滤波的过程,每一个卷积核都相当于一个滤波器,CNN中卷积层后会加入池化来降维,实现特征的降维,减小网络的参数量,常用的池化方式有最大值池化与均值池化,激励层通过非线性函数实现数据的非线性化,常见的有RELU,TAN等,用来给网络加入非线性能力,反向传播算法(Back-propagationAlgorithm,BP)则用来更新CNN网络中的参数。由于CNN网络独特的感受野机制,CNN具有旋转以及尺度不变性,在图像目标检测任务中能取得很好的效果。总体而言,CNN通过卷积,池化与非线性激活的一定组合可以实现对输入数据的抽象特征的提龋特征提取的过程属于前向传播的过程。在实现任务时,CNN会将任务量化为损失函数的形式。损失函数表示任务真实值与网络预测值之间的误差,之后,计算经过前向传播得到预测值与真实值之间的误差,通过BP算法将误差从网络最后一层向前反馈,以减小误差的方向对网络中参数进行更新。更新后再次通过前向传播,重复迭代,直至损失函数收敛到一定范围,模型训练完成[32]。图2.3LeNet网络结构Figure2.3LeNetnetworkstructure现代CNN网络结构可以追朔到1980年,研究员模拟人类视觉系统设计出了可以实现手写字符识别等任务的深层人工神经网络,这是CNN网络最早的前身。1998年专家提出了用于手写数字识别的卷积神经网络,LeNet。如图2.3所示。LeNet网络一共包括
中北大学学位论文143个卷积层以及3个全连接层,另外还有2个池化层。经过手写字符识别任务的验证,LeNet达到了99%的正确率,美国邮政系统识别邮政编码也采用了该网络结构。之后,在ImageNet图像分类大赛上获得第一名的AlexNet网络被提出,网络结构如图2.4所示。AlexNet网络共有5个卷积层,3个池化层以及3个全连接层[33]。图2.4AlexNet网络结构Figure2.4AlexNetnetworkstructure(2)卷积层卷积层是CNN网络重要的基本结构之一,卷积层主要功能是依靠卷积操作提取待检图像的特征。每层卷积层中都含有大量的卷积核,卷积核的数量及尺寸都可能影响CNN网络的性能。传统的全连接网络将每一个神经元全部连接,使得网络拥有大量的参数,难以训练,现代CNN网络通过卷积以局部连接和全局共享的形式,降低了网络的参数量和计算量,同时减少了出现过拟合的现象[34]。卷积操作的本质是滤波的过程,在CNN网络中以离散卷积的形式出现的,在图像目标检测过程中,应用最多的是二维卷积,相关操作如图2.5所示。
【参考文献】
相关期刊论文 前1条
1 蔡广基,严玉清;构建BP网络结构方法分析[J];河南师范大学学报(自然科学版);2001年03期
相关博士学位论文 前2条
1 丁鹏;基于深度卷积神经网络的光学遥感目标检测技术研究[D];中国科学院大学(中国科学院长春光学精密机械与物理研究所);2019年
2 刘旭;基于深度融合网络学习的多源遥感图像分类[D];西安电子科技大学;2019年
相关硕士学位论文 前10条
1 孙敏;基于级联全卷积网络的肝脏肿瘤分割技术及应用[D];南京邮电大学;2019年
2 陈子杰;基于深度全卷积神经网络的头颈部CT中放疗危及器官分割方法研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2019年
3 赵强;基于骨架点分割算法的文本验证码攻击模型的研究[D];西安电子科技大学;2019年
4 黄龙;基于全卷积神经网络的室内场景分割算法研究[D];西安理工大学;2019年
5 汪志文;基于深度学习的高分辨率遥感影像语义分割的研究与应用[D];北京邮电大学;2019年
6 徐梦楚;基于深度学习的智能教室视觉检测系统[D];北京邮电大学;2019年
7 赵昀瑶;战场态势评估中的目标分群与识别[D];西安电子科技大学;2019年
8 张鹏;基于卷积神经网络的多尺度遥感图像目标检测方法研究[D];西安电子科技大学;2019年
9 郭峰;基于深度卷积神经网络遥感图像目标检测算法研究[D];哈尔滨理工大学;2019年
10 黄科;TBM施工岩渣自动识别技术研究[D];石家庄铁道大学;2019年
本文编号:2869253
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2869253.html
最近更新
教材专著