基于深度学习的道路目标检测问题研究
发布时间:2020-07-22 11:02
【摘要】:智能交通系统在缓解交通压力、提高交通效率和保障交通安全等方面发挥着重要作用,一直受到人们的广泛关注。车辆前方目标的自动检测是智能交通系统的重要组成部分。另一方面,随着深度学习技术的飞速发展,利用深度神经网络进行目标的检测与分类己经成为近些年来业界的共识。因此,本文采用基于深度学习的方法,针对道路目标检测中目标尺寸较小、目标全时段检测及目标样本不均衡等问题进行深入讨论,具体的研究工作及成果如下:(1)针对交通标志尺寸较小的问题,本文基于Faster R-CNN(Faster Region-based Convolutional Neural Networks)检测算法,搭建并实现了特征金字塔网络,综合利用粗粒度与细粒度特征进行交通标志的检测。实验结果表明,本文所用方法与原始Faster R-CNN相比,交通标志的检测精度得到了大幅提升,相比其他同类算法的检测性能也表现出了一定的优越性。(2)针对机动车的全时段检测问题,本文在R-FCN(Region-based Fully Convolutional Networks)检测算法的基础上,设计并实现了一种新的全时段机动车检测框架。该框架以检测性能为目标,自适应划分不同的光照环境,实现机动车的全时段检测。实验结果表明,本文提出的框架不仅在一定程度上改善了机动车的检测性能,而且大幅度节约了计算资源,实现了检测系统的整体优化。(3)针对多类目标同时检测时的样本不均衡问题,本文提出了一种目标检测分级结构,实现道路场景中行人、机动车、交通标志、障碍物等常见目标的同时检测。除数据增强外,所提方法利用分级检测的思想,对道路场景中样本较少的交通标志进行由粗到细的两级检测。实验结果表明,本文提出的策略可以缓解多类目标同时检测时的样本不均衡问题,提高多类目标同时检测的整体精度。综上所述,本文针对前方道路目标检测中的多个问题,提出了较为有效的解决方案,一定程度上改善了小目标检测、全时段检测及多类同时检测的效果,为后续辅助驾驶及自动驾驶系统的开发奠定了基础。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;TP391.41;U495
【图文】:
择性搜索算法提取候选框,耗时巨大,无法满足实时应用的需求。逡逑直到2015年,Ren等人在以上两种算法的基础上提出了新的Faster邋R-CNN算逡逑法,实现了真正的端到端的检测和训练,其结构如图2-1所示。逡逑W建议网络J候选框逡逑(00/逡逑p邋一邋预测逡逑卷积层逦特征图逦感兴趣区域池化逡逑图2-1邋Faster邋R-CNN算法结构示意图逡逑Figure邋2-1邋Architecture邋of邋Faster邋R-CNN逡逑10逡逑
图2-2人类视觉系统结构示意图[7eI逡逑Figure邋2-2邋Structure邋of邋human邋visual邋system170'逡逑从图2-2中可以看出,在接收到信息后,大脑需要对其进行不断地迭代和抽象。逡逑视网膜在接收到原始信息后,信息首先进入低层的VI区域,经过初步处理后得到逡逑边缘、方向、角度等特征信息,其次经由V2区域的进一步抽象得到轮廓、形状等逡逑特征信息,如此迭代地经过更多更高层的抽象后,得到整个目标以及目标的行为逡逑信息,从而对目标进行更为精细的分类。逡逑这说明高层特征是由低层特征组合而成的。当层级越高时,其特征表示也就逡逑越抽象,而越高的抽象层面则代表着越少的可能性猜测,越有利于分类。逡逑(2)神经网络的层级结构之特征可视化逡逑卷积神经网络也具有与人脑相似的层级结构。在神经网络中,生成低层特征逡逑图的降采样幅度较小
conv5_3层的感受野大小示意图如图2-4所示。逡逑表2-1邋VGG-16中不同层的感受野大小逡逑Table邋2-1邋Receptive邋field邋of邋different邋layers邋in邋VGG-16逡逑层级逦conv2_l逦conv3_l逦conv3_3逦conv4_l逦conv4_3逦conv5_l逦conv5_3逡逑感受野大小邋10逦24逦40逦60逦92逦132逦196逡逑13逡逑
本文编号:2765724
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;TP391.41;U495
【图文】:
择性搜索算法提取候选框,耗时巨大,无法满足实时应用的需求。逡逑直到2015年,Ren等人在以上两种算法的基础上提出了新的Faster邋R-CNN算逡逑法,实现了真正的端到端的检测和训练,其结构如图2-1所示。逡逑W建议网络J候选框逡逑(00/逡逑p邋一邋预测逡逑卷积层逦特征图逦感兴趣区域池化逡逑图2-1邋Faster邋R-CNN算法结构示意图逡逑Figure邋2-1邋Architecture邋of邋Faster邋R-CNN逡逑10逡逑
图2-2人类视觉系统结构示意图[7eI逡逑Figure邋2-2邋Structure邋of邋human邋visual邋system170'逡逑从图2-2中可以看出,在接收到信息后,大脑需要对其进行不断地迭代和抽象。逡逑视网膜在接收到原始信息后,信息首先进入低层的VI区域,经过初步处理后得到逡逑边缘、方向、角度等特征信息,其次经由V2区域的进一步抽象得到轮廓、形状等逡逑特征信息,如此迭代地经过更多更高层的抽象后,得到整个目标以及目标的行为逡逑信息,从而对目标进行更为精细的分类。逡逑这说明高层特征是由低层特征组合而成的。当层级越高时,其特征表示也就逡逑越抽象,而越高的抽象层面则代表着越少的可能性猜测,越有利于分类。逡逑(2)神经网络的层级结构之特征可视化逡逑卷积神经网络也具有与人脑相似的层级结构。在神经网络中,生成低层特征逡逑图的降采样幅度较小
conv5_3层的感受野大小示意图如图2-4所示。逡逑表2-1邋VGG-16中不同层的感受野大小逡逑Table邋2-1邋Receptive邋field邋of邋different邋layers邋in邋VGG-16逡逑层级逦conv2_l逦conv3_l逦conv3_3逦conv4_l逦conv4_3逦conv5_l逦conv5_3逡逑感受野大小邋10逦24逦40逦60逦92逦132逦196逡逑13逡逑
【参考文献】
相关期刊论文 前1条
1 杨永辉;黄磊;刘昌平;;基于视频分析的车辆排队长度检测[J];计算机应用研究;2011年03期
相关硕士学位论文 前1条
1 何春燕;基于卷积神经网络的车行环境多类障碍物检测与识别[D];重庆邮电大学;2017年
本文编号:2765724
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2765724.html