当前位置:主页 > 管理论文 > 工程管理论文 >

多阶段遥感图像目标检测方法研究

发布时间:2021-07-31 21:27
  目标检测在自然场景和遥感场景中的研究极具挑战。尽管许多先进的算法在自然场景下取得了优异的成果,但是遥感图像的复杂性、目标尺度的多样性及目标密集分布的特性,使得针对遥感图像目标检测的研究步伐缓慢。本文提出一个新颖的多类别目标检测模型,可以自动学习特征融合时的权重,并突出目标特征,实现在复杂的遥感图像中有效地检测小目标和密集分布的目标。模型在公开数据集DOTA和NWPU VHR-10上的实验结果表明检测效果超过了大多数经典算法。 

【文章来源】:计算机与现代化. 2020,(09)

【文章页数】:7 页

【部分图文】:

多阶段遥感图像目标检测方法研究


E-CasNet整体框架

网络结构图,网络结构,特征融合,特征图


基于以上分析,本文在FPN的基础上改进特征融合网络,设计特征融合模块Mix-Net,结构如图2所示。本文称改进后的特征融合网络为IFPN(Improved FPN)。相比于FPN的特征融合策略,Mix-Net更加具有普适性,其可以根据目标特征自动学习特征融合时的权重。对于语义信息较强但分辨率较低的特征图,Mix-Net通过反卷积[21]操作对其上采样,其采样步长为2(上采样因子为2)。这种上采样方法的优势在于反卷积层的权重是不固定的,在网络训练中可根据目标的特征自动学习出来,也就是说特征图中不同区域的上采样方式不是既定的,而是在训练过程中被学习得到。接下来,经过上采样的特征图与自下而上网络中相同分辨率的特征图进行融合,图2详细展示了本文的融合方法。自下而上网络中的特征图经过一个1×1卷积层后,与经过上采样后相同分辨率的特征图堆叠,然后增加一个3×3卷积层进行特征融合。这种融合方法通过对卷积层权重的学习可以学到最佳的融合方式,而逐像素相加的方式实际上是既定了融合的权重,相比之下Mix-Net采用的融合方式更具有普适性和可优化性。遥感图像中的目标种类繁多且大小形状多变,除了对于特征融合方式的改进,本文在锚框的设置方面也采用了更适合遥感图像特性的方法。锚框的基础尺寸为256,缩放尺度为{1/16,1/8,1/4,1/2,1,2/1},考虑到遥感图像数据集中目标具有不同的形状,锚框的长宽比设置为{1:1,1:2,1:3,1:4,1:5,1:6,1:7,1:9}。以上这些设置可以尽可能保证更多的真实目标边框被分类为正样本。针对锚框的分类策略本文采用与FPN相同的方式,即当IoU>0.7时,将锚框判定为正样本,当IoU<0.3时,将锚框判定为负样本,当IoU在0.3~0.7之间时,锚框不参与训练。

网络结构图,网络结构,阶段,特征图


基于以上讨论,本文在精检测阶段结合了各个分辨率下的融合特征图,充分利用了目标的上下文信息,如图4所示。具体地,先对{F3,F4,F5}上采样至与A2相同尺寸,上采样方法与Mix-Net的方式相同,然后将{A2,F3,F4,F5}堆叠得到包含丰富上下分信息的特征图Dc。精检测阶段所有候选区域的裁剪操作均在特征图Dc上完成。为了提高计算速度,在训练阶段NMS选取分数最高的12000个回归边框并保留2000个作为候选区域,在测试阶段NMS选取10000个回归边框并保留300个做为候选区域。本文在精检测阶段的检测网络结构及IoU阈值设置方法均采用与Cascade R-CNN相同的方式。2.4 多任务损失函数


本文编号:3314216

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3314216.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户81886***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com