基于孪生网络的实时视觉目标跟踪算法
发布时间:2020-03-26 14:51
【摘要】:视觉目标跟踪是计算机视觉领域中的热门研究之一,在智能监控、人机交互、安防监控等领域具有广泛的应用场景。近年来,虽然研究人员已经提出了大量优秀的视觉目标跟踪算法,但是实现一个鲁棒的实时视觉跟踪算法依然极具挑战性。视觉目标跟踪的挑战主要来源于跟踪场景的复杂性和多变性(如相似干扰物,局部遮挡)和视觉跟踪算法自身的缺陷。视觉跟踪算法设计的难点在于精度和效率之间的平衡。本文主要围绕基于孪生网络的实时视觉目标跟踪展开了研究,本文的主要贡献点如下:(1)提出了一种基于自适应特征选择网络的跟踪算法(ASNT)。为了提升基于回归网络通用物体跟踪算法在线适应目标的能力,ASNT引入一种可学习的选择单元,用于增强目标相关的卷积特征通道,减弱噪声响应。通过将回归网络分为特征表示、选择单元和运动回归等三个构成部分,选择性地对网络进行微调,增强了跟踪器在线适应目标的能力。此外,提出通道随机失活方法,有效避免了离线训练过程和在线学习时的过拟合现象。(2)提出了一种基于分类回归孪生网络与在线块滤波器网络相结合的跟踪算法。针对孪生网络容易受到相似干扰物的影响,在离线训练过程中,提出了一种图像混合的方式,缓解了简单背景和复杂背景数据不均衡问题,同时增强了利用小规模数据集训练的网络的泛化能力。在线跟踪过程中,通过一种高效的块滤波器网络引入了目标的局部细节特征。并且,利用在线难样本学习的方式避免了相似物体对跟踪器的干扰,从而提升了整体跟踪性能。通过在目标跟踪的权威数据集上进行了大量的定量实验分析、属性分析、定性实验分析、模块有效性分析、和参数选择分析等实验,验证了本文提出的目标跟踪算法(ASNT和SiamRPN_OPF)的跟踪性能达到接近最先进算法的水平。本文提出的改进算法,在保证实时性的前提下,提升了基于孪生网络跟踪算法的准确率。通过模块有效性分析实验证明了本文提出的跟踪算法的有效性。
【图文】:
华南理工大学硕士学位论文第二章 视觉目标跟踪算法概述跟踪的定义是:给定待跟踪目标在视频序列初始图像帧中的中,,跟踪算法需要不断预测输出跟踪目标的位置。单目标视是先对目标进行特征描述,然后在后续视频序列中找到与跟位置。视觉目标跟踪算法通常由以下步骤构成[50],如图 2-1、观测模型和模型更新。
示 和 是否表示的是同一个物体。 表示不同物试阶段,固定所有的参数,利用目标在初始帧中的询特征与候选集中每个样本特征的欧式距离,距离erest)即为跟踪的目标。5], SiamFC[37]采用了全卷积方式,避免 SINT[35]中SiamFC[37]的网络结构图如图 2-3 所示,SiamFC[37图像块 x 的特征 ( )进行卷积得到响应图 r。响应元素 r[u]表示了搜索图像块对应位置 u 图片小块辑斯蒂损失(Logistic Loss)作为损失函数,如式(2-| = ( ) ( ) L(| -) = ∑ £ ( ¤( ))
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TN713
本文编号:2601589
【图文】:
华南理工大学硕士学位论文第二章 视觉目标跟踪算法概述跟踪的定义是:给定待跟踪目标在视频序列初始图像帧中的中,,跟踪算法需要不断预测输出跟踪目标的位置。单目标视是先对目标进行特征描述,然后在后续视频序列中找到与跟位置。视觉目标跟踪算法通常由以下步骤构成[50],如图 2-1、观测模型和模型更新。
示 和 是否表示的是同一个物体。 表示不同物试阶段,固定所有的参数,利用目标在初始帧中的询特征与候选集中每个样本特征的欧式距离,距离erest)即为跟踪的目标。5], SiamFC[37]采用了全卷积方式,避免 SINT[35]中SiamFC[37]的网络结构图如图 2-3 所示,SiamFC[37图像块 x 的特征 ( )进行卷积得到响应图 r。响应元素 r[u]表示了搜索图像块对应位置 u 图片小块辑斯蒂损失(Logistic Loss)作为损失函数,如式(2-| = ( ) ( ) L(| -) = ∑ £ ( ¤( ))
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TN713
【参考文献】
相关博士学位论文 前3条
1 崔雨勇;智能交通监控中运动目标检测与跟踪算法研究[D];华中科技大学;2012年
2 焦波;面向智能视频监控的运动目标检测与跟踪方法研究[D];国防科学技术大学;2009年
3 孔晓东;智能视频监控技术研究[D];上海交通大学;2008年
本文编号:2601589
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2601589.html