基于SSD算法的交通场景行人检测研究
发布时间:2020-12-15 04:30
行人检测技术是智能辅助驾驶系统中的关键技术,一直以来也是计算机视觉领域的研究热点之一,能有效减少交通事故的发生,提高驾驶的安全性,对保障人民群众的生命财产安全具有重大意义。但是由于交通场景中的行人目标存在姿态多变、行人所处的背景环境复杂以及行人目标较小等情况,使得目前的行人检测算法在实际应用中存在检测精度不高、检测速度较慢的问题。因此针对道路交通场景下的行人检测任务,考虑精确度和实时性检测的需要,论文基于SSD算法对交通场景行人目标的检测进行了研究。本文主要工作如下:首先介绍了目前主流的YOLO目标检测算法的工作原理及实现流程,通过对交通场景中行人的检测,分析实验数据可知该算法检测速度较快,但对尺度变化较大的物体泛化能力较差,当图像中有过于密集的目标时,容易发生误检、漏检的情况。其次,为了解决上述问题,本文主要研究了与YOLO算法同样满足实时性要求的SSD算法,该算法达到了和两阶段方法相当的精度,同时又保持了较快的运行速度。但是传统的SSD算法对于交通场景中小尺度行人目标的检测能力仍然不够理想,基于此,对SSD算法在网络结构上做出了以下改进:(1)卷积层结合稀疏连接。通过将主干网络的卷...
【文章来源】:安徽师范大学安徽省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
基于HOG特征的行人检测流程图
各特征通道进行计算,解决了多种特征进行融合从而导致的计算速度变慢的难题。同时,由于这种特征结合了多种其它的特征,所以对图像特征能从不同的角度来很好地表达,提高了检测的准确率。但是随之带来的图像特征维度的增加,增加了模型对特征计算的时间和分类器的检测时间,影响了检测的实时性。2010年Zhu等[28]将AdaBoost分类器级联的策略应用到了人体检测中,利用积分直方图快速计算HOG特征,同时通过Adaboost算法构建级联分类器,该方法的检测速度比Dalal等所提出的普通HOG特征算法快了将近70倍,大大提高了检测速度。图1-2是基于级联Cascade分类器的检测流程图。图1-2基于级联Cascade分类器的检测流程图同年,P.F.Felzenszwalb等人[29]提出形变部件模型(DPM),使用HOG特征,对行人目标的不同部位分别建模,解决了行人目标检测中遮挡严重的难题。此外,DPM也考虑到了目标内部的结构,能够很好地检测不同姿态的行人,并能很好地区分目标和背景。但是也存在明显的局限性。一方面是由于DPM特征的复杂,计算速度较慢;另一方面是基于人工设计的特征对于易于形变物体以及视角变化严重的物体检测效果较差。基于人工构造模型的方法虽然可通过提取颜色、纹理和梯度等人体的各种基本特征,再利用模式识别的方法进行分类,对于背景比较单一,尺度变化不大的目标能检测出来。但是由于使用到的特征相对比较单一,当应用于有旋转、尺度变化、视角变化的行人目标检测时效果较差。所以,为了寻求解决行人检测的遮挡情况、姿态多变、背景复杂以及目标较小等难点问题,基于深度学习的行人检测方法得到了国内外学者和工程师广泛地研究和应用,并取得了较好的成果。(2)基于深度学习模型的方法从2012年开始,随着大规模图像分类识别数据集ImageNet发布,深度卷?
6对交通场景中小尺度行人的检测能力。1.3行人检测研究难点相比于通用的目标检测任务,针对道路交通环境下以行人为目标的检测任务,其具有很强的特殊性和复杂性,需要面对更大的困难和挑战。主要表现在以下几个方面:(1)更加复杂的背景由于是在道路交通场景中检测行人,常伴随着昼夜,晴雨雪天气的影响以及光线的变化,还有障碍物的遮挡等情况,同时很多与行人在外形上相似的物体,容易对算法的检测产生干扰,无法准确区分背景和目标,导致算法的检测效果变差。因此,行人检测相对于通用的目标检测任务来说更加复杂,如下图1-3所示是道路交通场景中的行人示意图。从图中可以发现,行人极易受到障碍物的遮挡,导致光线视角不好,并且行人的穿着打扮丰富多变,人体的高矮胖瘦等体态变化较大,显著性较低,加大了检测的难度,很容易被漏检误检,精确检测比较困难[44]。此外,在一些人群比较密集的情况下,行人与行人之间遮挡严重,摄像头只捕捉到行人躯干的一部分,这对目标检测算法带来了严重的挑战。图1-3道路交通场景行人示意图(2)多尺度的目标针对道路交通场景下的行人检测,首先,行人本身就具有高矮胖瘦等不同大小
本文编号:2917664
【文章来源】:安徽师范大学安徽省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
基于HOG特征的行人检测流程图
各特征通道进行计算,解决了多种特征进行融合从而导致的计算速度变慢的难题。同时,由于这种特征结合了多种其它的特征,所以对图像特征能从不同的角度来很好地表达,提高了检测的准确率。但是随之带来的图像特征维度的增加,增加了模型对特征计算的时间和分类器的检测时间,影响了检测的实时性。2010年Zhu等[28]将AdaBoost分类器级联的策略应用到了人体检测中,利用积分直方图快速计算HOG特征,同时通过Adaboost算法构建级联分类器,该方法的检测速度比Dalal等所提出的普通HOG特征算法快了将近70倍,大大提高了检测速度。图1-2是基于级联Cascade分类器的检测流程图。图1-2基于级联Cascade分类器的检测流程图同年,P.F.Felzenszwalb等人[29]提出形变部件模型(DPM),使用HOG特征,对行人目标的不同部位分别建模,解决了行人目标检测中遮挡严重的难题。此外,DPM也考虑到了目标内部的结构,能够很好地检测不同姿态的行人,并能很好地区分目标和背景。但是也存在明显的局限性。一方面是由于DPM特征的复杂,计算速度较慢;另一方面是基于人工设计的特征对于易于形变物体以及视角变化严重的物体检测效果较差。基于人工构造模型的方法虽然可通过提取颜色、纹理和梯度等人体的各种基本特征,再利用模式识别的方法进行分类,对于背景比较单一,尺度变化不大的目标能检测出来。但是由于使用到的特征相对比较单一,当应用于有旋转、尺度变化、视角变化的行人目标检测时效果较差。所以,为了寻求解决行人检测的遮挡情况、姿态多变、背景复杂以及目标较小等难点问题,基于深度学习的行人检测方法得到了国内外学者和工程师广泛地研究和应用,并取得了较好的成果。(2)基于深度学习模型的方法从2012年开始,随着大规模图像分类识别数据集ImageNet发布,深度卷?
6对交通场景中小尺度行人的检测能力。1.3行人检测研究难点相比于通用的目标检测任务,针对道路交通环境下以行人为目标的检测任务,其具有很强的特殊性和复杂性,需要面对更大的困难和挑战。主要表现在以下几个方面:(1)更加复杂的背景由于是在道路交通场景中检测行人,常伴随着昼夜,晴雨雪天气的影响以及光线的变化,还有障碍物的遮挡等情况,同时很多与行人在外形上相似的物体,容易对算法的检测产生干扰,无法准确区分背景和目标,导致算法的检测效果变差。因此,行人检测相对于通用的目标检测任务来说更加复杂,如下图1-3所示是道路交通场景中的行人示意图。从图中可以发现,行人极易受到障碍物的遮挡,导致光线视角不好,并且行人的穿着打扮丰富多变,人体的高矮胖瘦等体态变化较大,显著性较低,加大了检测的难度,很容易被漏检误检,精确检测比较困难[44]。此外,在一些人群比较密集的情况下,行人与行人之间遮挡严重,摄像头只捕捉到行人躯干的一部分,这对目标检测算法带来了严重的挑战。图1-3道路交通场景行人示意图(2)多尺度的目标针对道路交通场景下的行人检测,首先,行人本身就具有高矮胖瘦等不同大小
本文编号:2917664
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2917664.html