基于深度强化学习的视觉追踪算法研究
发布时间:2021-07-11 00:33
物体追踪是计算机视觉领域非常重要的研究方向,近年来备受研究者们的关注和青睐。视觉追踪是对视频第一帧图像中需要跟踪的物体进行标注,在后续的图像中标记出待追踪物体的位置和对应的边框。近年来基于卷积神经网络的视觉追踪算法取得了突破性的进展,但是这种方法仅提取图像的局部为特征,并没有考虑到不同图像中追踪物体位置之间的依赖关系。本文提出使用递归网络学习不同序列之间的依赖关系,同时使用卷积网络预测不同状态下每个动作的执行概率,使用策略梯度算法优化目标函数,提出了基于深度强化学习的视觉追踪算法。强化学习旨在构造一个马尔科夫决策过程,学习状态和动作之间的映射关系,将视觉追踪任务定义为马尔科夫决策过程,当前的物体在不同的时刻下通过一系列的动作得到待追踪物体的位置。长短记忆模型通过当前的输入和上一时刻隐含的状态输出作为网络的输入去学习不同序列的依赖关系。本文在介绍了基于深度学习的卷积神经网络和强化学习的策略梯度算法的基础上,深入分析了经典的深度学习的视觉追踪算法,并提出了基于深度强化学习的视觉追踪方法,经过实验对比分析,本文所提出的方法能够运用到实际的环境中并且提升了追踪效率。
【文章来源】:山西大学山西省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
视觉追踪案例
第二章 视觉追踪算法基础理论视觉追踪是给定视频第一帧图像中需要跟踪物体的位置和边框,在后续的图像中标注出物体出现的位置。本章首先详细的阐述了基于判别模型的视觉追踪算法,然后系统的介绍了深度卷积网络和递归网络的基本架构。2.1 视觉追踪算法追踪物体的运动过程中,除了物体在图像中位置发生变化,背景中的相关的信息也会发生变化,出现的噪音和干扰像素会影响跟踪物体的边界定位。同时在不同的时间序列下,待跟踪物体的形态,所占图像比例的大小也会发生变化,背景中不相干物体对目标的遮挡也会影响跟踪的效果。如图 2.1 所示,图中列举了跟踪目标在不同时刻下呈现的姿态。在第一帧图像中,目标形态背景和轮廓比较清晰,在后续的三张图像中,图像的左下角出现了另外一个人,产生了对物体的局部遮挡,在后期的图像中,物体的形态都发生了不同程度的变化。
图 2.2 候选框示意图了候选框之后,使用特征提取算法得到候选位置区域的特征,然后输当前学习到的图像是前景还是背景。在这个环节中,最重要的是图像传统手动设计的特征提取方法并不能准确的刻画图像的语义信息,近的发展,基于深度卷积网络的图像分类方法取得了巨大的成就。使用视觉追踪算法的流程,如下图 2.3 所示:图 2.3 基于深度网络的视觉追踪算法流程
【参考文献】:
期刊论文
[1]基于Faster RCNN以及多部件结合的机场场面静态飞机检测[J]. 戴陈卡,李毅. 计算机应用. 2017(S2)
[2]Faster-RCNN的车型识别分析[J]. 桑军,郭沛,项志立,罗红玲,陈欣. 重庆大学学报. 2017(07)
[3]基于Fast R-CNN的车辆目标检测[J]. 曹诗雨,刘跃虎,李辛昭. 中国图象图形学报. 2017(05)
[4]多特征融合的多模板协同相关跟踪[J]. 毛宁,杨德东,杨福才,蔡玉柱. 液晶与显示. 2017(02)
[5]深度学习框架Caffe在图像分类中的应用[J]. 王茜,张海仙. 现代计算机(专业版). 2016(05)
[6]基于局部分块和模型更新的视觉跟踪算法[J]. 侯志强,黄安奇,余旺盛,刘翔. 电子与信息学报. 2015(06)
[7]稀疏性正则化非负矩阵分解的在线学习方法[J]. 薛模根,徐国明,王峰. 模式识别与人工智能. 2013(03)
[8]对立色LBP模型的目标跟踪[J]. 张炯,宁纪锋,颜永丰,于伟. 中国图象图形学报. 2012(11)
[9]基于改进Bhattacharyya系数的粒子滤波视觉跟踪算法[J]. 朱明清,王智灵,陈宗海. 控制与决策. 2012(10)
[10]视觉跟踪技术研究现状及其展望[J]. 李谷全,陈忠泽. 计算机应用研究. 2010(08)
硕士论文
[1]基于判别学习的单目标跟踪系统研究与实现[D]. 刘鹏举.哈尔滨工业大学 2016
[2]基于HOG特征和模板匹配的行人检测与跟踪研究[D]. 周科嘉.吉林大学 2014
[3]基于视觉的运动目标检测与跟踪技术研究[D]. 彭超.重庆大学 2014
[4]基于传统方法和深度学习的图像精细分类研究[D]. 张恒亨.合肥工业大学 2014
本文编号:3276966
【文章来源】:山西大学山西省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
视觉追踪案例
第二章 视觉追踪算法基础理论视觉追踪是给定视频第一帧图像中需要跟踪物体的位置和边框,在后续的图像中标注出物体出现的位置。本章首先详细的阐述了基于判别模型的视觉追踪算法,然后系统的介绍了深度卷积网络和递归网络的基本架构。2.1 视觉追踪算法追踪物体的运动过程中,除了物体在图像中位置发生变化,背景中的相关的信息也会发生变化,出现的噪音和干扰像素会影响跟踪物体的边界定位。同时在不同的时间序列下,待跟踪物体的形态,所占图像比例的大小也会发生变化,背景中不相干物体对目标的遮挡也会影响跟踪的效果。如图 2.1 所示,图中列举了跟踪目标在不同时刻下呈现的姿态。在第一帧图像中,目标形态背景和轮廓比较清晰,在后续的三张图像中,图像的左下角出现了另外一个人,产生了对物体的局部遮挡,在后期的图像中,物体的形态都发生了不同程度的变化。
图 2.2 候选框示意图了候选框之后,使用特征提取算法得到候选位置区域的特征,然后输当前学习到的图像是前景还是背景。在这个环节中,最重要的是图像传统手动设计的特征提取方法并不能准确的刻画图像的语义信息,近的发展,基于深度卷积网络的图像分类方法取得了巨大的成就。使用视觉追踪算法的流程,如下图 2.3 所示:图 2.3 基于深度网络的视觉追踪算法流程
【参考文献】:
期刊论文
[1]基于Faster RCNN以及多部件结合的机场场面静态飞机检测[J]. 戴陈卡,李毅. 计算机应用. 2017(S2)
[2]Faster-RCNN的车型识别分析[J]. 桑军,郭沛,项志立,罗红玲,陈欣. 重庆大学学报. 2017(07)
[3]基于Fast R-CNN的车辆目标检测[J]. 曹诗雨,刘跃虎,李辛昭. 中国图象图形学报. 2017(05)
[4]多特征融合的多模板协同相关跟踪[J]. 毛宁,杨德东,杨福才,蔡玉柱. 液晶与显示. 2017(02)
[5]深度学习框架Caffe在图像分类中的应用[J]. 王茜,张海仙. 现代计算机(专业版). 2016(05)
[6]基于局部分块和模型更新的视觉跟踪算法[J]. 侯志强,黄安奇,余旺盛,刘翔. 电子与信息学报. 2015(06)
[7]稀疏性正则化非负矩阵分解的在线学习方法[J]. 薛模根,徐国明,王峰. 模式识别与人工智能. 2013(03)
[8]对立色LBP模型的目标跟踪[J]. 张炯,宁纪锋,颜永丰,于伟. 中国图象图形学报. 2012(11)
[9]基于改进Bhattacharyya系数的粒子滤波视觉跟踪算法[J]. 朱明清,王智灵,陈宗海. 控制与决策. 2012(10)
[10]视觉跟踪技术研究现状及其展望[J]. 李谷全,陈忠泽. 计算机应用研究. 2010(08)
硕士论文
[1]基于判别学习的单目标跟踪系统研究与实现[D]. 刘鹏举.哈尔滨工业大学 2016
[2]基于HOG特征和模板匹配的行人检测与跟踪研究[D]. 周科嘉.吉林大学 2014
[3]基于视觉的运动目标检测与跟踪技术研究[D]. 彭超.重庆大学 2014
[4]基于传统方法和深度学习的图像精细分类研究[D]. 张恒亨.合肥工业大学 2014
本文编号:3276966
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3276966.html