基于深度学习的复杂背景下目标检测与跟踪
发布时间:2020-12-30 11:18
目标检测与跟踪是目前计算机视觉方向的研究热点之一,在无人驾驶技术、智能安防、医学影像辅助诊断等诸多领域都扮演着重要角色。尽管科研学者提出了许多在数据集上性能优异的目标检测与跟踪算法,可是在现实场景中,由于目标的形变、背景复杂、遮挡以及离开视场等众多因素的影响,还有在实际应用时设备对算法的实时性要求,目标检测与跟踪依然存在极大挑战。本文通过对基于深度学习的目标检测与跟踪算法的研究,分析了现有目标检测算法和目标长期跟踪算法存在的问题并做出了相应的改进,论文主要的研究内容包含下面两个方面:(1)对现有的基于深度学习的目标检测算法进行研究与分析后,针对YOLOv3进行深入研究,分析了算法存在的三点不足并进行优化。针对手工设定的锚点框无法确保适合所有目标的问题,采用自适应锚点框,根据目标在图像中出现的概率和长宽比自适应地生成锚点框,产生候选区域;针对传统特征金字塔结构在处理不同尺度特征图时存在梯度不一致性的问题,利用自适应空间特征融合算法来克服不同尺度特征图之间存在的梯度不一致性;针对常用的边框回归损失函数与网络性能评价指标没有直接关联的问题,采用更加符合评价指标的损失函数,提升网络性能。最后在...
【文章来源】: 余秀源 中国科学院大学(中国科学院光电技术研究所)
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
基于计算机视觉的测温仪
第2章基于深度学习的目标检测相关理论11第2章基于深度学习的目标检测相关理论2.1基于深度学习的目标检测代表算法2.1.1基于候选区域的目标检测原理基于候选区域的目标检测算法的代表是FasterRCNN,算法框架如图2.1所示,主要包括四个部分,特征提取网络,区域候选网络,空间池化层和分类器。图2.1FasterRCNN框架图[48]Figure2.1FrameofFasterRCNN算法的主要流程为输入图片经过特征提取网络得到整张图像的特征图。区域候选网络在特征图的每个像素点上按照三种不同尺寸和三种比例生成9个锚点框并对应到原图生成候选区域,然后对所有的候选区域进行初步的分类与回归,区分出目标和背景,再经过筛选得到与真实目标框较为接近的候选区域。通过空间池化层将不同尺寸的候选区域的特征调整为固定大校最后将空间池化层输出的特征图输入到两个全连接层中,完成分类与回归。两个全连接层的输出分别为目标的类别和目标的坐标。2.1.2基于回归的目标检测原理基于回归的目标检测算法代表是YOLO系列算法。其算法框架如图2.2所示,基本思想是将目标检测直接看作目标边框和目标类别的回归问题。和基于候
基于深度学习的复杂背景下目标检测与跟踪12选区域的目标检测方法相比,最直接的区别在于区域候选网络被取消了。YOLO通过一个卷积神经网络利用整副图像的特征来预测目标类别和位置,实现了简洁的高效目标检测。图2.2YOLO框架图[48]Figure2.2FrameofYOLO算法的主要流程是首先通过特征提取网络得到整副图像的特征图,同时也相当于将原始图像分为了S×S的网络,每个然后以每个网格为中心,按照预先设定的锚点框预测目标类别的概率分布和目标边框。然后通过回归修正,得到最终的输出。由于区域候选网络的取消,YOLO算法的运算速度提升非常快,在GPU上能达到45帧每秒,能够对视频进行实时检测。2.1.3基于特征金字塔的目标检测原理许多基于深度学习的目标检测算法都使用最后一层特征图来预测目标的类别与坐标,但是检测尺度变化范围巨大且长宽比例不确定的目标仅仅使用最后一层特征图是不够的。深度神经网络每一层学到的特征包含有不同的信息。浅层特征分辨率高,感受野比较小,所以包含有丰富的空间信息,比较适合检测小目标。深层特征分辨率低,感受野比较大,所以包含有丰富的语义信息,对于目标发生的光照变化和平移等有较强的鲁棒性,比较适合检测大目标。如图2.3所示,特征金字塔网络自顶向下的将不同尺度的特征图通过横向连接的方式融合在一起,构建了类似金字塔结构的特征图组。这样使浅层特征也包含有语义信息,深层特征包含有位置信息,提升了各个尺度特征图的表达性能。然后分别对每个特征图进行预测,以提升目标检测算法检测不同尺度目标的性能。
【参考文献】:
期刊论文
[1]轻量化卷积神经网络技术研究[J]. 毕鹏程,罗健欣,陈卫卫. 计算机工程与应用. 2019(16)
[2]基于深度学习的医学图像分割研究进展[J]. 宫进昌,赵尚义,王远军. 中国医学物理学杂志. 2019(04)
[3]具备重检测机制的融合特征视觉跟踪算法[J]. 李中科,万长胜. 图学学报. 2018(05)
[4]目标跟踪算法综述[J]. 卢湖川,李佩霞,王栋. 模式识别与人工智能. 2018(01)
[5]深度学习在无人驾驶汽车领域应用的研究进展[J]. 王科俊,赵彦东,邢向磊. 智能系统学报. 2018(01)
[6]基于深度学习和医学图像的癌症计算机辅助诊断研究进展[J]. 陈诗慧,刘维湘,秦璟,陈亮亮,宾果,周煜翔,汪天富,黄炳升. 生物医学工程学杂志. 2017(02)
[7]无人机成“玩具”后,反无人机产业悄然兴起[J]. 梁丽雯. 金融科技时代. 2017(02)
[8]“深度学习”技术开启智能安防新篇章[J]. 满江月. 中国公共安全. 2015(20)
[9]基于外观模型学习的视频目标跟踪方法综述[J]. 张焕龙,胡士强,杨国胜. 计算机研究与发展. 2015(01)
[10]基于尺度不变特征的光流法目标跟踪技术研究[J]. 吴垠,李良福,肖樟树,刘侍刚. 计算机工程与应用. 2013(15)
硕士论文
[1]均值漂移算法在视频运动目标跟踪中的应用研究[D]. 张剑华.西安电子科技大学 2015
本文编号:2947552
【文章来源】: 余秀源 中国科学院大学(中国科学院光电技术研究所)
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
基于计算机视觉的测温仪
第2章基于深度学习的目标检测相关理论11第2章基于深度学习的目标检测相关理论2.1基于深度学习的目标检测代表算法2.1.1基于候选区域的目标检测原理基于候选区域的目标检测算法的代表是FasterRCNN,算法框架如图2.1所示,主要包括四个部分,特征提取网络,区域候选网络,空间池化层和分类器。图2.1FasterRCNN框架图[48]Figure2.1FrameofFasterRCNN算法的主要流程为输入图片经过特征提取网络得到整张图像的特征图。区域候选网络在特征图的每个像素点上按照三种不同尺寸和三种比例生成9个锚点框并对应到原图生成候选区域,然后对所有的候选区域进行初步的分类与回归,区分出目标和背景,再经过筛选得到与真实目标框较为接近的候选区域。通过空间池化层将不同尺寸的候选区域的特征调整为固定大校最后将空间池化层输出的特征图输入到两个全连接层中,完成分类与回归。两个全连接层的输出分别为目标的类别和目标的坐标。2.1.2基于回归的目标检测原理基于回归的目标检测算法代表是YOLO系列算法。其算法框架如图2.2所示,基本思想是将目标检测直接看作目标边框和目标类别的回归问题。和基于候
基于深度学习的复杂背景下目标检测与跟踪12选区域的目标检测方法相比,最直接的区别在于区域候选网络被取消了。YOLO通过一个卷积神经网络利用整副图像的特征来预测目标类别和位置,实现了简洁的高效目标检测。图2.2YOLO框架图[48]Figure2.2FrameofYOLO算法的主要流程是首先通过特征提取网络得到整副图像的特征图,同时也相当于将原始图像分为了S×S的网络,每个然后以每个网格为中心,按照预先设定的锚点框预测目标类别的概率分布和目标边框。然后通过回归修正,得到最终的输出。由于区域候选网络的取消,YOLO算法的运算速度提升非常快,在GPU上能达到45帧每秒,能够对视频进行实时检测。2.1.3基于特征金字塔的目标检测原理许多基于深度学习的目标检测算法都使用最后一层特征图来预测目标的类别与坐标,但是检测尺度变化范围巨大且长宽比例不确定的目标仅仅使用最后一层特征图是不够的。深度神经网络每一层学到的特征包含有不同的信息。浅层特征分辨率高,感受野比较小,所以包含有丰富的空间信息,比较适合检测小目标。深层特征分辨率低,感受野比较大,所以包含有丰富的语义信息,对于目标发生的光照变化和平移等有较强的鲁棒性,比较适合检测大目标。如图2.3所示,特征金字塔网络自顶向下的将不同尺度的特征图通过横向连接的方式融合在一起,构建了类似金字塔结构的特征图组。这样使浅层特征也包含有语义信息,深层特征包含有位置信息,提升了各个尺度特征图的表达性能。然后分别对每个特征图进行预测,以提升目标检测算法检测不同尺度目标的性能。
【参考文献】:
期刊论文
[1]轻量化卷积神经网络技术研究[J]. 毕鹏程,罗健欣,陈卫卫. 计算机工程与应用. 2019(16)
[2]基于深度学习的医学图像分割研究进展[J]. 宫进昌,赵尚义,王远军. 中国医学物理学杂志. 2019(04)
[3]具备重检测机制的融合特征视觉跟踪算法[J]. 李中科,万长胜. 图学学报. 2018(05)
[4]目标跟踪算法综述[J]. 卢湖川,李佩霞,王栋. 模式识别与人工智能. 2018(01)
[5]深度学习在无人驾驶汽车领域应用的研究进展[J]. 王科俊,赵彦东,邢向磊. 智能系统学报. 2018(01)
[6]基于深度学习和医学图像的癌症计算机辅助诊断研究进展[J]. 陈诗慧,刘维湘,秦璟,陈亮亮,宾果,周煜翔,汪天富,黄炳升. 生物医学工程学杂志. 2017(02)
[7]无人机成“玩具”后,反无人机产业悄然兴起[J]. 梁丽雯. 金融科技时代. 2017(02)
[8]“深度学习”技术开启智能安防新篇章[J]. 满江月. 中国公共安全. 2015(20)
[9]基于外观模型学习的视频目标跟踪方法综述[J]. 张焕龙,胡士强,杨国胜. 计算机研究与发展. 2015(01)
[10]基于尺度不变特征的光流法目标跟踪技术研究[J]. 吴垠,李良福,肖樟树,刘侍刚. 计算机工程与应用. 2013(15)
硕士论文
[1]均值漂移算法在视频运动目标跟踪中的应用研究[D]. 张剑华.西安电子科技大学 2015
本文编号:2947552
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2947552.html