基于场景透视的无人机目标检测方法
发布时间:2024-02-22 04:32
无人机目标检测是计算机视觉领域近年来兴起的重要课题之一,有着较高的学术意义和应用价值。随着无人机在工业、农业、安防和生活等各行业的普及,对无人机拍摄数据进行视觉分析的需求正在显著增加。当前的无人机目标检测解决方案,主要是将成熟的深度学习通用目标检测方法迁移至无人机场景。然而,无人机拍摄数据存在场景多变、视角变化幅度大、目标尺度多样性广等数据特点,通用目标检测方法很难在准确度和速度两方面给出满意的结果。本文分析无人机场景的数据特点后,围绕“通过场景模型给出尺度预计进而引导目标检测”这一核心思路,从场景中目标之间的透视关系出发,对无人机目标检测展开研究,主要工作包括:1)提出无人机场景透视建模方法。通过分析无人机数据,指出检测任务的核心挑战在于目标的尺度多样性。以无人机图像能反映场景结构为出发点,提出基于透视的场景建模,并实验分析了该模型对无人机场景的适用性,以及和其他尺度多样性解决方案相比的优点。所提透视估计图通过推测目标与镜头的距离、换算形变参数、生成透视标注、神经网络估计等模块,完成了对图像中目标尺度分布和置信度分布的估计。2)研究场景透视在现有目标检测框架下的利用形式。通过透视模型...
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
本文编号:3906398
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图1-1通用目标检测和无人机检测的数据对比
第一章绪论1第一章绪论1.1研究背景及意义目标检测(ObjectDetection)是计算机视觉领域的经典任务之一,其目的是对图像中的目标进行分类和定位。目标检测一方面是许多视觉任务的研究基础,如实例分割、目标跟踪、图像翻译等;另一方面具备极高的实际应用价值,业界大量基于视觉方法....
图1-3VisDrone和UAVDT中充满挑战的无人机场景
第一章绪论5富性和真实性,且多视角多目标的特性较为契合本文的研究主题,因此本文中选取了该数据集作为主要的研究对象。同为2018年发布的UAVDT[23]也是一个具有研究价值的数据集,该数据集虽然仅标注了小型客车、卡车、大型客车三个类别的2700个目标,数据量小于VisDrone数....
图2-1FasterR-CNN的框架结构
华南理工大学硕士学位论文14图2-1FasterR-CNN的框架结构1.提取特征的主干网络。主干网络部分为多层的CNN架构,最初的FasterR-CNN使用的是VGG-16。由于检测框架和主干网络之间的独立性,任意成熟的CNN均可胜任这一任务。当前的目标检测主干网络通常在Imag....
图3-1视角多样性和包裹框不适配性
华南理工大学硕士学位论文243.3.1尺度估计图对于每一张输入的待检测图片,其对应的尺度估计图PES的目的是描述每一个像素位置处,如果出现了需要检测的目标,其最可能的尺度是多大,可以用公式(3-1)进行表述:=(,)=(3-1)其中i代表待检测图像,j代表图像中的某个像素位置。代....
本文编号:3906398
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3906398.html