基于深度学习的点云三维目标检测算法研究
发布时间:2021-06-22 11:31
目标检测是自动驾驶和机器人视觉领域的核心技术之一。在自动驾驶领域,车辆通常使用激光雷达(LiDAR)和多个摄像头实现目标感知。由于激光雷达传感器相比摄像头能够输出精确的环境点云数据,因此在车辆传感器系统里具有不可替代的作用。然而,由于激光雷达输出的点云数据的稀疏特性,无法将传统深度学习目标检测方法直接用于点云目标检测。本文针对这一现状,使用以体素和稀疏卷积为主的深度卷积神经网络,依据点云数据进行3D目标检测,对相关理论算法展开研究,获得了较好的实验效果。本文主要研究内容如下:(1)介绍了基于深度学习的目标检测算法,包括单阶段和两阶段目标检测器,重点分析了两阶段目标检测器的方法,同时研究了一个典型的基于体素的点云目标检测算法。(2)介绍了卷积算法和稀疏卷积算法,针对当前稀疏卷积算法匹配位置矩阵生成速度过慢的问题,提出了并行匹配位置矩阵生成算法,使其可以更快地在并行计算设备上执行。(3)针对当前基于体素的点云3D目标检测算法做出多项改进,首先提出了稀疏中间特征提取器,大幅提高网络的执行速度;其次提出了新的角度损失函数来处理当前角度回归的对抗样本问题;最后,提出了一种数据增强方法,利用点云数...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
FasterRCNN结构图
重庆大学硕士学位论文2基于深度学习的目标检测算法理论基础8征图。接着这些区域兴趣被送往区域卷积神经网络(RCNN),对每个区域兴趣的特征执行分类和微调回归,后者即对RPN得到的边界框做进一步的微调。最后对这些得到的结果进行后处理,包括非极大抑制算法(NMS),就能得到最终的检测结果。下面详细介绍各部分的内容。2.1.2卷积特征提取器简介正如前面提到的那样,目标检测的第一步是得到图像的特征,一般使用在大规模图像数据集(ImageNet)上训练好的图像分类模型,然后使用这些模型在模型头部(Head)进行全局池化之前的卷积层输出作为图像的特征图输出。特征提取器网络的选择并不是固定的,虽然越先进的网络性能表现通常都会更好,但速度因素也是重要的考虑因素。我们下面简单介绍一个典型的图像分类网络:VGG网络。图2.2VGG卷积神经网络结构图Fig.2.2ThestructureoftheVGGconvolutionnetwork如图2.2所示,假定输入为一个尺寸为224*224*3的图片数组,这里需要使用固定尺寸输入,因为在图像分类网络里,由于最后使用全连接而不是卷积层进行分类,而全连接层需要固定尺寸的输入。在VGG网络作为目标检测的特征提取器时,通常使用图中尺寸为14*14*512的卷积层的输出作为提取出来的图像特征。由于卷积层可以被用在任意尺寸的图片上,而目标检测算法不使用后面的全连接层输出,所以在目标检测中没有固定输入图片尺寸的限制。
重庆大学硕士学位论文2基于深度学习的目标检测算法理论基础9每个卷积层都会根据前面的输入特征来创建抽象特征。在图2.3中可以看到每当我们对特征图进行降维,特征图的数量通常都会加倍,虽然空间维度降低,但是该位置所包含的信息更多,这是卷积神经网络设计的一个重要原则之一。最后我们会从卷积特征提取器里得到空间尺寸较小但是通道数很多的特征图。图2.3卷积特征提取过程示意图Fig.2.3Theconvolutionfeatureextractionprocess2.1.3锚简介在使用特征提取器得到图像的特征图后,为了进行初步的目标检测,我们需要得到区域兴趣(RegionofInterest,ROI)。一个自然的想法就是对特征图的每个位置都预测目标分数和对应的边界框,直接预测边界框会出现一个问题:如果预测的边界框的长宽为负,这个预测就是完全无效的。另外为了对于那些有些重叠的目标,它们的中心位置往往会落在特征图的同一个位置下。为了解决这些问题,FasterRCNN引入了锚(Anchor)的概念。锚是一系列对于固定特征图尺寸来说完全固定的边界框。对于每个特征图位置,都会预先放置一系列长宽比例以及尺寸都不同的锚,在进行预测的时候,得到的边界框是相对于这些固定的锚的偏移量。对于同一位置来说,我们预测了很多不同尺寸的边界框的偏移量及其分数,这些ROI会被统一按分数排序从而能够检测不同尺寸的目标。在推理过程中,锚的产生是一次性的,因为对于某个固定尺寸的图像,其锚也是完全固定的,因此锚的产生不会带来任何推理负担。2.1.4区域建议网络RPN及其损失函数简介区域建议网络RPN用来输出第一阶段的目标检测结果,即目标分数(该位置
【参考文献】:
期刊论文
[1]改进YOLO v3的安全帽佩戴检测方法[J]. 施辉,陈先桥,杨英. 计算机工程与应用. 2019(11)
[2]基于改进Faster R-CNN的子弹外观缺陷检测[J]. 马晓云,朱丹,金晨,佟新鑫. 激光与光电子学进展. 2019(15)
[3]基于改进SSD的果园行人实时检测方法[J]. 刘慧,张礼帅,沈跃,张健,吴边. 农业机械学报. 2019(04)
[4]基于深度学习的复杂背景雷达图像多目标检测[J]. 周龙,韦素媛,崔忠马,房嘉奇,杨小婷,杨龙. 系统工程与电子技术. 2019(06)
[5]基于级联CNN的SAR图像舰船目标检测算法[J]. 李健伟,曲长文,彭书娟. 控制与决策. 2019(10)
硕士论文
[1]基于深度学习的物体检测与跟踪方法的研究[D]. 曾钰廷.东华理工大学 2018
本文编号:3242760
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
FasterRCNN结构图
重庆大学硕士学位论文2基于深度学习的目标检测算法理论基础8征图。接着这些区域兴趣被送往区域卷积神经网络(RCNN),对每个区域兴趣的特征执行分类和微调回归,后者即对RPN得到的边界框做进一步的微调。最后对这些得到的结果进行后处理,包括非极大抑制算法(NMS),就能得到最终的检测结果。下面详细介绍各部分的内容。2.1.2卷积特征提取器简介正如前面提到的那样,目标检测的第一步是得到图像的特征,一般使用在大规模图像数据集(ImageNet)上训练好的图像分类模型,然后使用这些模型在模型头部(Head)进行全局池化之前的卷积层输出作为图像的特征图输出。特征提取器网络的选择并不是固定的,虽然越先进的网络性能表现通常都会更好,但速度因素也是重要的考虑因素。我们下面简单介绍一个典型的图像分类网络:VGG网络。图2.2VGG卷积神经网络结构图Fig.2.2ThestructureoftheVGGconvolutionnetwork如图2.2所示,假定输入为一个尺寸为224*224*3的图片数组,这里需要使用固定尺寸输入,因为在图像分类网络里,由于最后使用全连接而不是卷积层进行分类,而全连接层需要固定尺寸的输入。在VGG网络作为目标检测的特征提取器时,通常使用图中尺寸为14*14*512的卷积层的输出作为提取出来的图像特征。由于卷积层可以被用在任意尺寸的图片上,而目标检测算法不使用后面的全连接层输出,所以在目标检测中没有固定输入图片尺寸的限制。
重庆大学硕士学位论文2基于深度学习的目标检测算法理论基础9每个卷积层都会根据前面的输入特征来创建抽象特征。在图2.3中可以看到每当我们对特征图进行降维,特征图的数量通常都会加倍,虽然空间维度降低,但是该位置所包含的信息更多,这是卷积神经网络设计的一个重要原则之一。最后我们会从卷积特征提取器里得到空间尺寸较小但是通道数很多的特征图。图2.3卷积特征提取过程示意图Fig.2.3Theconvolutionfeatureextractionprocess2.1.3锚简介在使用特征提取器得到图像的特征图后,为了进行初步的目标检测,我们需要得到区域兴趣(RegionofInterest,ROI)。一个自然的想法就是对特征图的每个位置都预测目标分数和对应的边界框,直接预测边界框会出现一个问题:如果预测的边界框的长宽为负,这个预测就是完全无效的。另外为了对于那些有些重叠的目标,它们的中心位置往往会落在特征图的同一个位置下。为了解决这些问题,FasterRCNN引入了锚(Anchor)的概念。锚是一系列对于固定特征图尺寸来说完全固定的边界框。对于每个特征图位置,都会预先放置一系列长宽比例以及尺寸都不同的锚,在进行预测的时候,得到的边界框是相对于这些固定的锚的偏移量。对于同一位置来说,我们预测了很多不同尺寸的边界框的偏移量及其分数,这些ROI会被统一按分数排序从而能够检测不同尺寸的目标。在推理过程中,锚的产生是一次性的,因为对于某个固定尺寸的图像,其锚也是完全固定的,因此锚的产生不会带来任何推理负担。2.1.4区域建议网络RPN及其损失函数简介区域建议网络RPN用来输出第一阶段的目标检测结果,即目标分数(该位置
【参考文献】:
期刊论文
[1]改进YOLO v3的安全帽佩戴检测方法[J]. 施辉,陈先桥,杨英. 计算机工程与应用. 2019(11)
[2]基于改进Faster R-CNN的子弹外观缺陷检测[J]. 马晓云,朱丹,金晨,佟新鑫. 激光与光电子学进展. 2019(15)
[3]基于改进SSD的果园行人实时检测方法[J]. 刘慧,张礼帅,沈跃,张健,吴边. 农业机械学报. 2019(04)
[4]基于深度学习的复杂背景雷达图像多目标检测[J]. 周龙,韦素媛,崔忠马,房嘉奇,杨小婷,杨龙. 系统工程与电子技术. 2019(06)
[5]基于级联CNN的SAR图像舰船目标检测算法[J]. 李健伟,曲长文,彭书娟. 控制与决策. 2019(10)
硕士论文
[1]基于深度学习的物体检测与跟踪方法的研究[D]. 曾钰廷.东华理工大学 2018
本文编号:3242760
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3242760.html
最近更新
教材专著