基于深度学习的机场检测数据集的研究
发布时间:2021-10-25 11:30
机场场面监视是一个复杂的问题,随着我国民航发展,机场管理人员对场面活动目标的监视管理越发困难,近几年来机场场面安全事故频发,因此,增强机场场面监视能力迫在眉睫。飞行器目标检测是机场场面监视的根本,其目的是准确完成飞行器的识别与定位任务,检测效果将直接影响到后续的跟踪、事件监测结果,这在场面监视系统中至关重要。近年来随着深度学习的兴起,基于深度学习的目标检测性能达到了较高水准。然而,深度学习严重依赖训练样本,目前没有专门针对机场的检测数据集,公共数据集中没有包含飞行器的各种姿态角度以及复杂天气条件下的数据,这种训练样本受限的情况将对检测算法产生严重影响。另外,目标检测普遍存在不平衡问题,由于机场监控图像的背景远大于前景,因此机场检测数据中的不平衡问题更为严重,为了更好地利用机场检测数据集,需要开展针对不平衡问题的研究。综上所述,制作包含机场场面上的各种情况、满足算法训练需求的数据集,并以此为基础针对机场不平衡问题提出相关检测方法是很有意义并富有挑战性的工作。本文的主要研究内容如下:1.研究了主流目标检测数据集的设计方案,针对每一个数据集使用YOLO、\Faster-RCNN、SSD算法训...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
RPN网络结构
电子科技大学硕士学位论文10图2-2ROI池化示意图ROI池化的另一个好处是节省了大量时间,检测算法大多时候都需要检测多个类别,使用这种方法可以为所有类别的判断使用相同尺寸的特征图,与之前的方法相比这无疑有着巨大的优势。分类部分利用已经获得的候选特征图,通过全连接层与softmax计算出每个类别的概率向量,从而判断每个目标具体属于哪个类别;同时通过边界框回归来获得每个候选框的偏移量,从而得到更加精确的检测框。2.1.2YOLO检测框架2016年YOLO算法的提出可以算作目标检测算法的里程碑,该算法的全称是YouOnlyLookOnce:Unified,Real-TimeObjectDetection,这个题目基本包含了YOLO算法的特点,即算法使用的是端到端的统一框架,整体上只需要进行一次CNN运算,且基本上能实现实时的目标检测。由于YOLOv1精度上有所欠缺,因此后续又提出了YOLOv2,YOLOv3两个改进版本,到了YOLOv3提出时与之前的单级检测算法相比甚至能同时在速度和精度上达到最优。这里我们将会对YOLO的整体思想以及每个版本的特点进行说明。
第2章基于深度学习的目标检测11图2-3网格划分与预测在YOLO框架中,输入一张图片可以直接获得目标的边界框以及目标类别概率,YOLO之前的两级目标检测方法都是基于区域建议的目标检测框架,就是先通过候选区域网络得到大量可能存在目标的候选框,然后再去判断每个候选框存在目标概率,最终判断其中存在的是什么。这种方法需要先得到候选框,再进行目标的检测,并且目标检测也分为了两部分,并不能端到端进行检测,因此这些算法在检测速度上远不如YOLO算法。YOLOv1做出的最重要的改变就是候选框划分的问题,它直接将输入图像划分成互不重合的小方块,然后通过卷积得到特定大小的特征图,基于CNN的特性,下一层特征图的每一个像素都与前一层的某一块相关,因此特征图的所有元素都可以用来可以预测那些中心点在该小方格内的目标,如图2-3所示。YOLOv1到v3的主要改变是基础网络的改变,YOLOv1中采用的是GooleNet,该网络有24个卷积层和2个全连接层,该网络采用了大量1×1卷积核,有效的减少了计算参数,提高了运行效率。而YOLOv2则提出了全新的Darknet-19网络,该网络有19个卷积层和5个池化层,其总体上的卷积计算比GoogleNet要少,因此减少了大量的计算量,并且该网络使用全局平均池化代替了全连接层。YOLOv2虽然在精度上已经达到了比较高的水准,但是距离最优还有一定距离,因此为了使检测效果更好,YOLOv3提出了darknet-53网络。
本文编号:3457307
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
RPN网络结构
电子科技大学硕士学位论文10图2-2ROI池化示意图ROI池化的另一个好处是节省了大量时间,检测算法大多时候都需要检测多个类别,使用这种方法可以为所有类别的判断使用相同尺寸的特征图,与之前的方法相比这无疑有着巨大的优势。分类部分利用已经获得的候选特征图,通过全连接层与softmax计算出每个类别的概率向量,从而判断每个目标具体属于哪个类别;同时通过边界框回归来获得每个候选框的偏移量,从而得到更加精确的检测框。2.1.2YOLO检测框架2016年YOLO算法的提出可以算作目标检测算法的里程碑,该算法的全称是YouOnlyLookOnce:Unified,Real-TimeObjectDetection,这个题目基本包含了YOLO算法的特点,即算法使用的是端到端的统一框架,整体上只需要进行一次CNN运算,且基本上能实现实时的目标检测。由于YOLOv1精度上有所欠缺,因此后续又提出了YOLOv2,YOLOv3两个改进版本,到了YOLOv3提出时与之前的单级检测算法相比甚至能同时在速度和精度上达到最优。这里我们将会对YOLO的整体思想以及每个版本的特点进行说明。
第2章基于深度学习的目标检测11图2-3网格划分与预测在YOLO框架中,输入一张图片可以直接获得目标的边界框以及目标类别概率,YOLO之前的两级目标检测方法都是基于区域建议的目标检测框架,就是先通过候选区域网络得到大量可能存在目标的候选框,然后再去判断每个候选框存在目标概率,最终判断其中存在的是什么。这种方法需要先得到候选框,再进行目标的检测,并且目标检测也分为了两部分,并不能端到端进行检测,因此这些算法在检测速度上远不如YOLO算法。YOLOv1做出的最重要的改变就是候选框划分的问题,它直接将输入图像划分成互不重合的小方块,然后通过卷积得到特定大小的特征图,基于CNN的特性,下一层特征图的每一个像素都与前一层的某一块相关,因此特征图的所有元素都可以用来可以预测那些中心点在该小方格内的目标,如图2-3所示。YOLOv1到v3的主要改变是基础网络的改变,YOLOv1中采用的是GooleNet,该网络有24个卷积层和2个全连接层,该网络采用了大量1×1卷积核,有效的减少了计算参数,提高了运行效率。而YOLOv2则提出了全新的Darknet-19网络,该网络有19个卷积层和5个池化层,其总体上的卷积计算比GoogleNet要少,因此减少了大量的计算量,并且该网络使用全局平均池化代替了全连接层。YOLOv2虽然在精度上已经达到了比较高的水准,但是距离最优还有一定距离,因此为了使检测效果更好,YOLOv3提出了darknet-53网络。
本文编号:3457307
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3457307.html