基于浅层学习引导深度学习的行人检测
发布时间:2019-09-23 14:23
【摘要】:随着我国宣布大力发展“互联网+”与“创新2.0”,“智慧城市”理念被正式提出。城市的发展带来交通流量的急速增长,疲劳驾驶、酒后驾驶等危害公共安全的现象屡禁不止,规范法律法规的同时,科技是强有力的辅助手段。“智慧城市”涉及自动驾驶、机器人、智能安防、虚拟现实(Virtual Reality, VR)、增强现实(Augmented Reality, AR)等多种技术。VR/AR被认为是未来十年最具市场潜力的技术,据美国高盛公司分析,到2025年全球VR/AR市场规模可达到1800亿美元。基于计算机视觉的精准的目标检测技术是上述这些技术的基石。基于计算机视觉的目标检测通常指的是在多媒体数据中(包括静态图像、视频序列等),使用计算机视觉算法自动识别并定位出物体。对人的研究一直以来都是计算机视觉中最重要的内容,人是一类特殊的物体,不但具有一般物体的普遍性,还具有类内变化多样的特殊性,这正是行人检测的难点所在。因此,行人检测的研究成果可以普适于一般目标的检测。行人检测的研究与探索既具有科研价值,也具有社会应用价值。近两年来,深度学习在计算机视觉领域取得了许多突破性成果,例如图像识别、目标检测、目标跟踪、图像分割等。深度学习大幅提高了行人检测的性能,但相比于浅层学习,深度学习的理论目前仍处于探索阶段。浅层学习模型简单、训练灵活、小样本训练的优点使其在很多领域还具有重要作用。若能提取合适的特征用于训练,浅层学习依然可以取得较好的性能。规避人工规则的特征提取是深度学习的主要优点之一,也是其潜在的不足之处。恰当的导向性在日常生活中具有重要的作用,在深度学习中亦是。在深度学习过程中,若能加入适当的引导,则可能取得更好的学习效果。本文由浅层学习的行人检测研究引入,说明提取合适的人工特征可以有效提高检测效果,最后落脚至深度学习的行人检测,说明浅层的引导学习可以提高深度模型精度。全文完成了以下工作:本文首先提出了一种快速提取高质量行人候选区域的方法BINGH,取代了传统的滑动窗口法。该方法大大减少了候选框的数量,减少了图像分类的工作量。二值赋范梯度(BING)是现在最好的目标推荐法之一,但仅采用了最简单的梯度(NG)特征,描述物体还存在一些局限性。均值哈希(aHash)特征可以很好地描述图像中的低频信息,且计算量极低。本文使用联合NG和aHash的二值赋范梯度哈希(BINGH)特征,既可以描述物体的轮廓边缘信息,又可以描述物体的低频结构信息。在使用人体单类训练时,仅提供500个候选区域时即达到了较高的DR (Detection Rate)。为了加速检测,本文提出的BINGH方法采取了计算机指令集(SSE)和位运算(BITWISE SHIFT)等多种优化方式,在单CPU上可以达到200帧/秒的检测速度。其次,提出了一种联合改进的HOG与自适应LBP的快速行人检测方法。首先使用基于学习的目标推荐法BINGH筛选行人候选区域,加速检测过程。随后在图像分类过程中,使用提出的HOG-ALBP联合算子提升LBP算子描述纹理的准确性,以减少单HOG算子容易引发的人体类似物体误检,并结合可形变部件模型(DPM)和隐变量SVM进一步提升检测效果。为了进一步加速检测,一方面使用特征算子预处理方法减少检测过程存在的计算冗余,另一方面从HOG特征自身角度优化计算量。实验结果显示,该方法降低了虚警率,提高了检测效率。再次,提出了一种联合概率聚合分割(SPA)与感知哈希(pHash)的行人检测方法。首先使用对比度保持去色(CPD)算法提高了灰度图像的对比度,更有利于图像识别。联合概率聚合分割和感知哈希组成的HSH (HOG-SPA-pHash)联合算子可以适应行人尺度变化、背景变化和图像清晰度变化。实验结果显示,在不使用DPM时,HSH联合算子自身依然具备一定的抗形变和抗遮挡的能力,且跨数据集检测效果较好,在某些数据集上取得了近似于深度学习方法的检测效果。最后,提出了浅层学习引导深度学习的行人检测方法Guided Faster R-CNN。本文使用基于浅层学习的SVM引导基于深度学习的卷积神经网络中的Dropout过程,提出了Selective Dropout,进一步降低了学习中的过拟合性。以深度学习为管道,浅层学习作引导,实现了浅层学习与深度学习的优势互补,引导学习增强了深度学习的泛化能力。同时,本文基于Faster R-CNN框架,在RPN中增加了自适应池化层以免除缩放图像步骤,在Fast R-CNN中增加了金字塔感兴趣区域池化层以适应更多尺度变化。另外,本文基于难例挖掘策略进行训练,并针对目前深度学习中的激活函数、隐层归一化等主流关键技术做了改进。实验结果显示,基于Caffe平台实现的Guided Faster R-CNN行人检测方法在多个数据集上取得了优秀的、实时的检测效果。很多行人检测算法存在鲁棒性和实时性问题,即无法很好地在效果和速度方面达到一个权衡。本文的方法具备较好的泛化性、实用性,与其他方法相比,检测效果有明显优势,检测速度满足实时检测的要求。
【图文】:
?逦非刚性形变与遮挡逡逑人体运动中容易受到前景物体的遮挡,同时,人的四肢常常于运动状态,,即便处于逡逑静止状态,也会产生不同的动作。人体的灵活性使得人的姿态千变万化,因此非刚性形逡逑变也产生了相应的检测困难,如图1-8所示。逡逑曊咖\∩瑰义贤迹保阜歉招郧杀溆胝诘档那杉戾义希垮尾嗝媸咏清义先颂宓墓鄄焓咏怯姓媸咏恰⒉嗝媸咏呛投ゲ渴咏牵渲姓媸咏呛筒嗝媸咏墙衔义铣<4蠖嗍觳馄鞫圆嗝媸咏堑男腥思觳庑Ч患眩缤迹保顾尽e义
本文编号:2540343
【图文】:
?逦非刚性形变与遮挡逡逑人体运动中容易受到前景物体的遮挡,同时,人的四肢常常于运动状态,,即便处于逡逑静止状态,也会产生不同的动作。人体的灵活性使得人的姿态千变万化,因此非刚性形逡逑变也产生了相应的检测困难,如图1-8所示。逡逑曊咖\∩瑰义贤迹保阜歉招郧杀溆胝诘档那杉戾义希垮尾嗝媸咏清义先颂宓墓鄄焓咏怯姓媸咏恰⒉嗝媸咏呛投ゲ渴咏牵渲姓媸咏呛筒嗝媸咏墙衔义铣<4蠖嗍觳馄鞫圆嗝媸咏堑男腥思觳庑Ч患眩缤迹保顾尽e义
本文编号:2540343
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2540343.html
最近更新
教材专著