深度学习的遥感影像舰船目标检测
发布时间:2021-09-18 12:12
针对传统舰船检测方法中流程繁琐,速度较慢且对于复杂背景区域的检测精度较低等问题,该文提出了一种改进的Faster R-CNN深度神经网络端到端自动检测方法。该方法通过数据增强技术对数据集进行扩充,使用深度残差网络ResNet替代传统平网络VGG-16对数据集进行特征提取,在区域生成网络中针对舰船目标长宽比较高的特点修改了标定框的长宽比,较好地解决了传统检测方法步骤繁琐,速度较慢等缺点,实现了对遥感影像舰船目标的自动检测。实验结果表明,改进后的Faster R-CNN检测算法能够对遥感影像中的舰船目标进行快速的精确检测,准确率可达92.3%,检测速度达到每秒5帧。即使在面对遥感影像背景复杂、目标局部遮挡问题时也能准确识别。和传统的ENVI与eCognition分类手段相比,该方法提升了目标检测效果和识别效率,Faster R-CNN检测算法相比该方法提升了检测精度。
【文章来源】:测绘科学. 2020,45(03)北大核心CSCD
【文章页数】:8 页
【部分图文】:
目标检测算法流程
式中:xl和xl+1分别表示的是第l个残差单元的输入与输出;F是残差函数,表示学习到的残差,而 h( x l ) 表示恒等映射;f表示relu激活函数;xL表示从浅层l到深层L学习到的特征。由于ResNet网络结构引入类似于“短接”式的设计将前面几层的数据输出直接跳过多层网络而引入后面数据层的输入部分,可以使网络在学习过程尽量避免数据的损失与压缩,使网络可以学到更为丰富的内容,也因此避免了在网络训练中的过拟合与梯度消失等问题。
2) 优化区域预测标定框。目标检测主要可分两步:定位与检测,RPN就是单独用来定位(location)的网络,RPN生成的预测候选区域的质量直接影响到目标检测任务的准确度。RPN的工作原理如图3所示,RPN是一个浅层的全卷积神经网络,由1个卷积核大小为1×1的卷积层与2个全连接层组成。先通过生成一个特定大小的滑动窗口,在本文中滑动窗口的大小为3×3,然后将滑窗在输入的特征映射图F上的每一个中心点上滑动,在每个中心点位置生成9个标定框(anchor),为了解决待检测目标大小比例不一样问题,将anchor赋予不同的面积和不同长宽比,在原Faster R-CNN中长宽比为(1∶1,1∶2,2∶1),可以很好地预测标定目标。然而通过对舰船遥感目标真实标定框的长宽比统计,具体的统计图如图4所示。发现舰船目标的长宽比较大,因此使用原RPN中的长宽比并不合适,故而将标定框的长宽比优化为(1∶1,1∶2,3∶1),这样更适合对舰船目标的检测。然后将这些标定框经过全卷积层进行运算,每一个标定框得到一个256维的向量,经过全连接层判断标定框中是否含有目标,判定标定框中是否存在的依据为候选标注框与人手工标注框(Ground Truth)的交并比(IOU),如果候选标定框与真实框的IOU大于0.7则认为其包含目标,为正样本。如果IOU小于0.3则认为其不包含目标,为负样本。最后从含有目标的标定框中得到候选标注框,并根据回归函数对候选标注框进行回归计算。图4 真实标定框长宽比统计
【参考文献】:
期刊论文
[1]光学遥感图像中复杂海背景下的舰船检测[J]. 王慧利,朱明,蔺春波,陈典兵,杨航. 光学精密工程. 2018(03)
硕士论文
[1]基于Faster R-CNN的人脸检测与识别算法研究与实现[D]. 尉冰.西安电子科技大学 2017
本文编号:3400116
【文章来源】:测绘科学. 2020,45(03)北大核心CSCD
【文章页数】:8 页
【部分图文】:
目标检测算法流程
式中:xl和xl+1分别表示的是第l个残差单元的输入与输出;F是残差函数,表示学习到的残差,而 h( x l ) 表示恒等映射;f表示relu激活函数;xL表示从浅层l到深层L学习到的特征。由于ResNet网络结构引入类似于“短接”式的设计将前面几层的数据输出直接跳过多层网络而引入后面数据层的输入部分,可以使网络在学习过程尽量避免数据的损失与压缩,使网络可以学到更为丰富的内容,也因此避免了在网络训练中的过拟合与梯度消失等问题。
2) 优化区域预测标定框。目标检测主要可分两步:定位与检测,RPN就是单独用来定位(location)的网络,RPN生成的预测候选区域的质量直接影响到目标检测任务的准确度。RPN的工作原理如图3所示,RPN是一个浅层的全卷积神经网络,由1个卷积核大小为1×1的卷积层与2个全连接层组成。先通过生成一个特定大小的滑动窗口,在本文中滑动窗口的大小为3×3,然后将滑窗在输入的特征映射图F上的每一个中心点上滑动,在每个中心点位置生成9个标定框(anchor),为了解决待检测目标大小比例不一样问题,将anchor赋予不同的面积和不同长宽比,在原Faster R-CNN中长宽比为(1∶1,1∶2,2∶1),可以很好地预测标定目标。然而通过对舰船遥感目标真实标定框的长宽比统计,具体的统计图如图4所示。发现舰船目标的长宽比较大,因此使用原RPN中的长宽比并不合适,故而将标定框的长宽比优化为(1∶1,1∶2,3∶1),这样更适合对舰船目标的检测。然后将这些标定框经过全卷积层进行运算,每一个标定框得到一个256维的向量,经过全连接层判断标定框中是否含有目标,判定标定框中是否存在的依据为候选标注框与人手工标注框(Ground Truth)的交并比(IOU),如果候选标定框与真实框的IOU大于0.7则认为其包含目标,为正样本。如果IOU小于0.3则认为其不包含目标,为负样本。最后从含有目标的标定框中得到候选标注框,并根据回归函数对候选标注框进行回归计算。图4 真实标定框长宽比统计
【参考文献】:
期刊论文
[1]光学遥感图像中复杂海背景下的舰船检测[J]. 王慧利,朱明,蔺春波,陈典兵,杨航. 光学精密工程. 2018(03)
硕士论文
[1]基于Faster R-CNN的人脸检测与识别算法研究与实现[D]. 尉冰.西安电子科技大学 2017
本文编号:3400116
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3400116.html