当前位置:主页 > 科技论文 > 自动化论文 >

基于卷积神经网络的实时行人检测

发布时间:2021-12-02 02:30
  随着计算科学和硬件设备的不断发展,计算机视觉也取得了飞跃式的发展。从最初的需要消耗很多时间精力人工设定规则提取特征的传统图像处理方法到现在利用深度学习自动学习有用特征的方法,计算机视觉可谓是向前跨了一大步,就单在目标检测这一项任务来看,检测一张图片中的目标所需要的时间从几百毫秒减少到十几毫秒,同时检测精度也从百分之二十几增加到百分之七八十。也正是因为计算机硬件的高速发展,计算机视觉可以广泛的应用在现实项目中,比如人脸验证、自动驾驶、智能视频监控等领域。在实际检测场景中,行人检测具有背景信息复杂,目标小等特点,导致检测难度相对一般的目标检测来说更加困难。因此,在实际场景应用中难以在保证时间效率的前提下提高检测的准确率。为解决上述问题,本文提出了一些基于卷积神经网络的改进方法。本文提出了基于并行多种感受野特征提取的网络用于实时行人检测。首先,由于实际场景图片中大多数为小目标,所以本文在特征提取的时候进行了一些改进,利用多个不同大小的感受野代替单一感受野的方法,使得网络在特征提取的时候不是使用单一感受野,而是并行的使用多个不同感受野的卷积核提取行人目标更加丰富的多层次特征,有利于提高行人检测... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

基于卷积神经网络的实时行人检测


R-CNN的网络结构

网络结构图,网络结构,候选框,提升速度


3 Fast R-CNN软研究院的 Ross B.Girshick 在 2015 年提出的 Fast R-CNN[38]在 SPP-N上进一步提升速度和准确率,其网络结构如图 2-2 所示,设计了一种 R结构来代替 SPP-Net 中的空间金字塔池化结构,ROI 池化层把候选框定大小的特征层,然后输入到之后的全连接层中得到特征向量。

网络结构图,网络结构,位置,锚点


图 2-3 RPN 网络结构黑色虚线方框为滑动框,在最后一个卷积层上滑动特征,在每个滑动窗口的位置生成 k 个 anchor(锚果不是很好,所以后面会接分类层和位置回归层,出锚点框里有没有目标,位置回归中有 4k 个输出,


本文编号:3527546

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3527546.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3fecf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com