当前位置:主页 > 科技论文 > 路桥论文 >

复杂交通场景下的视频目标检测

发布时间:2021-11-25 12:03
  计算机视觉作为一个热门的研究方向,随着卷积神经网络的兴起,在工业化生产和日常生活中得到了更加广泛的应用。其中,视频目标检测作为计算机视觉的重要分支,近些年来得到了极大的发展,在智能交通领域中扮演着极其重要的角色。目前大多数目标检测算法能够在常规的环境中很好地将目标检测出来,但是在复杂场景或极端条件下的鲁棒性还有待提高。此外,视频帧中远端目标在特征图上的响应特别低,极大地限制了常规检测算法的性能。同时,由于现在大部分的视频目标检测算法过于复杂,导致推理速度慢,无法实现实时检测,难以应用到实际生活中。因此,实现复杂场景下的视频目标检测是热点也是难点。针对以上问题,本文从视频目标检测的精度与速度两个方面展开研究,主要方法如下:(1)针对复杂交通场景下视频帧中远端目标易与背景融合导致检测精度不佳的问题,本文将传统运动目标检测与主流卷积网络检测算法相结合,提出了一种由外观流和运动流组成的双流视频目标检测框架,分别挖掘目标的外观信息与运动信息。与此同时,为了解决因遮挡或运动模糊造成的目标在随后帧中丢失的问题,本文引入一个循环注意力模块来捕获相邻视频帧中的时空相关性。在双流网络中,本文利用主流的检测... 

【文章来源】:安徽大学安徽省 211工程院校

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

复杂交通场景下的视频目标检测


R-CNN检测框架

框架图,框架,卷积,特征图


第二章相关算法介绍10从图中可以看出FastR-CNN与R-CNN的三个不同之处,第一便是FastR-CNN将整张图送入卷积网络,而不是像R-CNN部分送入;第二是使用Roipooling层输出固定大小的特征;第三是使用了多任务损失函数,结合了分类损失函数与边框回归损失函数。因此,本节就从以上FastR-CNN的三个改进做出详细介绍。卷积神经网络采用选择性搜索提取了2000个左右的候选框,并且对所有的候选框对应的图像区域进行卷积计算。由于存在许多冗余候选框,消耗了过多计算资源,因此FastR-CNN采取的做法是对原始的整个图像进行一次卷积操作,得益于选择性搜索框建立在原图上,可以直接按照比例找到其对应的特征图,去除了特征图的重复提取,从而节约了运算时间。FastR-CNN在卷积层后添加Roipooling层的目的是使输入的图片不被尺寸限制。AlexNet在提取特征时对输入的图片大小无限制,只不过是对提取后的特征图进行全连接操作时需要固定尺寸。因此,FastR-CNN在输入任意尺寸的图片后,只需在全连接操作之前加入Roipooling层,将候选框对应的特征图池化到H*W大小,随后对每个小窗口进行最大值池化,在每个小窗口中的值取最大保留下来。如此一来,不论输入的图像是怎么样的尺寸,Roipooling层都能将其转化成固定的H*W大小,各个候选框对应的特征图都能以同一大小进入下一层。R-CNN分别对卷积计算、候选框的分类与回归进行处理,使得训练过程变得复杂,因此FastR-CNN替换了R-CNN中的SVM分类器为Softmax。同时为了融合多个训练步骤,FastR-CNN使用多任务损失函数,同时优化分类与回归。这样FastR-CNN变图2.2FastR-CNN检测框架Fig.2.2FastR-CNNDetectionFramework

框架图,框架,冲突问题,目标检测


第二章相关算法介绍12使用候选区域网络的特征,因此候选框的生成几乎是零成本。相比于FastR-CNN,不论是在精度还是速度上都有明显的提升。FasterR-CNN的检测速度几乎是FastR-CNN的15倍,其在VOC2007数据集上的精测精度达到了73.2%,相比于FastR-CNN也有着巨大的提升。2.2.4R-FCNFasterR-CNN在目标检测领域已经取得了巨大成功,之后很多目标检测网络大多都借助了FasterR-CNN的思想,但是在FasterR-CNN中却存在分类与定位敏感性冲突问题。FasterR-CNN的整个检测过程大致分为两部分,第一部分利用分类网络提取基础特征,第二部分是找出候选框对应的特征图进行进行分类并修正位置。第一部分的提取基础特征的分类网络例如Vgg[16]、ResNet[17]等,要求是不论物体出现在哪个位置都能对其做出准确分类,因此目标分类网络具有方位不敏感性。而在第二部分的网络中,希望不论是什么物体都能在图像中找出其准确位置,因此检测网络具有目标不敏感性。为了缓和敏感性冲突问题,R-FCN提出了位置敏感得分图(Position-SensitiveScoreMaps)。图2.3FasterR-CNN检测框架Fig.2.3FasterR-CNNDetectionFramework

【参考文献】:
期刊论文
[1]一种基于背景减除与三帧差分的运动目标检测算法[J]. 莫林,廖鹏,刘勋.  微计算机信息. 2009(12)
[2]基于帧间差分方法的道路车辆检测系统[J]. 崔星,闫清东.  微计算机信息. 2007(10)



本文编号:3518101

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3518101.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8286c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com