当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的路面障碍目标3D检测

发布时间:2021-08-13 03:41
  本文针对无人驾驶环境中的路面障碍目标3D检测问题提出了两种解决方案:基于单目相机的3D目标检测方案与基于单目相机与激光雷达相结合的3D目标检测方案。这两种方案都是在2D目标检测的结果上进行3D包围框的预测。首先,我们以YOLOv3为基础设计了一个2D目标检测网络,并对损失函数进行改进,引入了Io U损失的概念。我们在KITTI数据集对网络进行训练和测试,得到网络对简单、容易、困难三个检测难度目标的m AP分别为0.79、0.67和0.59,且网络完成一次预测的时间只有15 ms,证明了我们设计的2D检测网络在精度与速度两方面可以满足后续的3D目标检测研究。其次,在单目检测算法的设计中,我们以VGG16作为特征提取器,设计了一个可以预测目标局部偏角和尺寸偏差的卷积神经网络,然后通过2D box与3D box间的几何约束来预测出完整的3D box。我们对算法在KITTI数据集上的测试结果进行分析,提出了一种校正网络来帮助网络更准确的定位3D box,最终得到了最大AP值27.3,最快检测速度23 ms的优秀成绩。然后,在单目+激光雷达联合的检测算法的设计中,我们利用相机-雷达投影变换得到2... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于深度学习的路面障碍目标3D检测


二维目标检测与三维目标检测3

模型图,模型,目标检测,神经网络


第2章基于卷积神经网络的目标检测算法研究8第2章基于卷积神经网络的目标检测算法研究2.1引言在深度学习得到快速发展之前,目标检测大多是基于传统图像处理和机器学习算法来研究的,用来识别目标的特征都是认为设计的,例如SIFT(尺度不变特征),HOG(方向梯度直方图特征),SURF(加速稳健特征)等[21]。与传统方法相比,深度学习己经被证明在计算机视觉和语音识别方面效果更加显著且拥有更高的普适性,已经成为了计算机视觉和语音识别领域的主流算法。在目标检测领域,主要应用到的深度神经网络模型是CNN(卷积神经网络),主要步骤是:首先对图像进行深度特征提取,然后基于深度神经网络完成目标的识别与定位。本章重点介绍了卷积神经网络的原理、基于卷积神经网络的目标检测算法在2D目标检测领域和3D目标检测领域的主流算法以及研究需要用到的基础知识。2.2卷积神经网络基础2.2.1多层感知机原理神经网络的诞生灵感来源于对生物大脑结构和功能的模仿,它的本质是一种模拟人脑神经元工作的信息处理系统,早在1957年,Rosenblat在文章出了感知机模型,首次把人工神经网络的研究从理论探讨付诸工程实践,引发了神经网络的研究浪潮。类比来说,感知机就相当于一个单独的神经元结构,模型如图2-1所示。图2-1感知机模型图中xi代表来自第i个神经元的输入,wi代表当前神经元与第i个神经元连接的权重,I是当前神经元的输出。神经元接收n个其他神经元传递过来的输入

基于深度学习的路面障碍目标3D检测


三层感知机的结构


本文编号:3339668

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3339668.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户08a96***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com