基于深度学习的行人检测与行为识别研究

发布时间:2021-02-15 18:21
  行人检测是计算机视觉领域中一个具有挑战性的问题,也是许多视觉应用的先决任务,例如自动驾驶、视觉监控和机器人技术等。在过去的十年中,行人检测引起了广泛的研究兴趣,并取得了长足的进步。特别是最近几年,得益于深度卷积神经网络的发展,通用目标检测领域取得了重大进步。受此驱动,行人检测也得到了迅速发展。基于深度卷积网络的通用目标检测模型被不断扩展应用到行人检测领域,并取得了良好的性能。对于行人检测任务,本文提出了一种基于特征感受野增强的网络模型结构。当前基于深度学习的行人检测模型大多采用分而治之的策略来解决行人检测中的尺度变化问题。在检测时,每一个特征层的感受野大小是固定的,无法适应实际情况中行人尺度的连续变化;而且这些检测模型大多采用图像分类中的骨干网络作为特征提取器,这些骨干网络仅仅具有方形的感受野,与行人的宽高比之间也存在着严重的不匹配;这些因素影响着行人检测模型的性能。针对上述问题,本文提出了一种基于特征感受野增强的网络模型作为解决方案。该方案利用感受野增强模块多样化从骨干网络中提取的特征的感受野,以提供合适的感受野与行人的尺度大小相匹配,并利用多层次聚合模块进一步聚合多尺度特征层,即融... 

【文章来源】: 罗鹏飞 中国科学技术大学

【文章页数】:78 页

【学位级别】:硕士

【部分图文】:

基于深度学习的行人检测与行为识别研究


图2.1人工神经网络??

结构图,结构图,卷积


才传输给下一个神经元的特??性。而损失函数和优化器方法则是研宄人员发明的,它们的功能是通过指导整??个卷积网络的学习过程,达到设计者期望的输出结果。??C3:?f.?maps?16@?10x10??INPUT?6@2ta289maP8?S4:l.map6l6?5KS??Full?connection?Gaussian?connections??Convolutions?Subsampling?Convolutions?Subsampling?Full?connection??图2.2?LeNet-5结构图丨叫??多层卷积网络的不同层可以提取具有不同抽象程度的图像特征信息,网络??的浅层通常能够捕捉到边缘、纹理等图像低层特征,而网络的较深层能够表示??提取到的高级语义特征,低层特征的不断融合和抽象形成了高级语义特征。对??于深度卷积网络的学习方式,请想象一条工厂流水线。输入数据集这一原材料??后,它们会沿着传送带向下传送,随后的每个停靠点也就是隐藏层,都会提取??出不同的高级特征信息。如果网络旨在识别某个物体,则第一层可以分析图像??中像素的亮度信息,然后下一层可以基于相似像素构成的线来识别图像中的边??缘信息。此后,另一层可以识别纹理和形状信息,以此类推。到第四或第五层??时,深度学习网络将创建出复杂的特征检测器,它可以确定某些图像元素通常??一起出现,例如双眼、鼻子和嘴巴。一旦特征提取完成,根据人类提供的数据??标签和网络输出结果之间的偏差,使用误差反向传播算法纠正网络的错误。一??段时间后,网络可以自动执行分类任务,而无需人工帮助。??与一般的人工神经网络相比,卷积网络具有许多优点,首先是局部连接,??每

示意图,卷积,示意图,卷积核


?第2章相关知识概述???骤,因此卷积操作的输出也被称为特征图。当以一定大小的卷积核在图像上进??行滑动卷积时,将会丢失图像边界的信息,通过引入填充操作在输入图像的边??界处填充零值的像素,从而可以间接地扩大图像的大小,避免了图像边界处信??息的丢失。此外,为了控制卷积操作在图像上滑动卷积的密度,采用了步长参??数,步长越大,卷积操作的密度越低。在卷积操作后,特征图由大量特征组成,??容易引起过拟合问题。因此提出了池化操作也称为下采样操作来消除特征冗余。??池化操作如图2.3所示,主要包括最大值池化和平均池化两种方式。????0.?0?"?TT?0?1?0?1?0?1?0??0?0?0?0?1?0?0?〇?.?〇?0?0?0?1?0?0?0??TTTT"F"FT?TTTTTTTTT?vrLEyE?? ̄o ̄TTTTTT?_?JJ:?T?o?TTTTTTT?^?__??T?丁丁?77?丁?7?l?TI?丁?T77?丁了?1H?A?A??????2?2?2?2?2?3??±±±±±±±?A丄上丄7?丁了了?^??0?0?1?0?0?1?0?0001?丄?0100??丄丄!丄?丄丄A丄A??iupu,?YTTV〇?〇??图2.3卷积网络基本搡作示意图Wl??此外,为了使卷积核能感知到更大的局部区域,膨胀卷积操作为卷积层引??入了一个额外的超参数膨胀率。图2.4?(a)显示了一个普通的3x3卷积核,图??2.4?(b)和(c)分别显示了一个膨胀率为2的3x3卷积核和一个膨胀率为4的??3x3卷积核。膨胀卷积操作是在每个卷积核的权值之间填充零值元素。即使卷??积核有效的权值大小仍然

【参考文献】:
期刊论文
[1]基于改进YOLOv2模型的驾驶辅助系统实时行人检测[J]. 白中浩,李智强,蒋彬辉,王鹏辉.  汽车工程. 2019(12)
[2]深度学习及其在目标和行为识别中的新进展[J]. 郑胤,陈权崎,章毓晋.  中国图象图形学报. 2014(02)
[3]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正.  计算机应用研究. 2012(08)
[4]行人检测技术综述[J]. 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东.  电子学报. 2012(04)

硕士论文
[1]面向智能视频监控系统的运动目标检测与异常行为分析[D]. 朱明凌.中国计量学院 2015



本文编号:3035328

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3035328.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户814dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com