复杂场景下的视觉对象跟踪建模及算法研究
发布时间:2021-09-24 05:57
对象跟踪是一个计算器视觉领域内的基本任务,该任务旨在从图像或者视频中寻找出目标物体。该任务在自动驾驶、智能监控、人机交互以及医学成像等多种运用中具有很高的实用价值,因此大量的研究力量被投入其中。然而,在真实的对象跟踪场景中,视频目标跟踪往往会由于复杂场景条件和目标运动的随机性而变得困难。在自然条件下,目标物体经常出现光照变化、旋转、伸缩、遮挡、曝光不足、背景变化、运动的复杂性和随机性等因素,这些都会使得对象跟踪变得非常困难。虽然对象跟踪算法已经取得了丰硕的研究成果,但在理论和应用上也存在着不完善和待解决的问题。在此背景下,研究复杂场景下的对象跟踪算法在理论和应用方面都具有非常重要的意义。从神经网络的模型结构出发,对现有的模型进行优化,结合真实对象跟踪场景特性,探索新的网络模型,研究新的处理算法,提高对象跟踪的性能和效率。研究成果主要在如下几个方面体现:首先,针对复杂场景下的跟踪失效及恢复问题,提出了一种基于自组织映射网络(Self-Organizing Maps,SOM)和相关滤波器的长期记忆对象跟踪算法。在对象跟踪中,不同的视频或图像中的同一种物体常常有着不同的外观,对这些外观进行学...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:110 页
【学位级别】:博士
【部分图文】:
对象跟踪的六种典型应用
1绪论31.2视觉对象跟踪系统结构对象跟踪的基本方法是给定第一帧中一般目标对象的初始状态(如位置和尺度),或者使用对象识别方法(例如,人脸[1]或行人[2]检测器)检测出第一帧中包含的对象的初始状态。利用对象跟踪算法在下一帧中产生众多候选框,并提取这些候选框的特征,在提取的特征基础上对这些候选框进行评分,最后找一个得分最高的候选框作为预测的目标。在图1.2中,我们展示了一个视觉对象跟踪的典型结构。概况起来,一个典型的视觉对象跟踪系统[3,4,5]一般由五个模块组成:(1)运动模型:产生候选样本。(2)外观建模:提取有效特征表示目标。(3)观测模型:为候选样本进行评分。(4)模型更新:更新观测模型使其适应目标的变化。(5)集成方法:结合多个预测获得最优的决策结果。运动模型生成候选样本的速度与质量直接决定了跟踪系统表现的优劣。运动模型可以表示为一个经典的动态状态估计问题:=(,)和=(,),其中 为当前状态, 为当前观测;为状态演化函数,为演化过程噪声; 为测量函数, 为测量噪声。估计的目标是计算给定观测数据的隐藏状态的最优估计,而运动估计则可作为贝叶斯规则[6]的递归形式导出。典型运动模型包括线性回归技术[7]、卡尔曼滤波器[8]、粒子滤波器[9,10]或相关滤波器[11]。外观建模通过不同类型的判别特征构建健壮的外观描述符。在以前的研究中,大量手工制作的特征模型被用来表示目标外观。如子空间表示[12]、颜色直方图[13]、方向梯度直方图(HOG)、哈尔特征(Haar)[14]、SURF[15]、ORB[16]和SuperPixels[17]。近年来,这些特性模型依靠深度卷积神经网络有了显著的进展,在视觉跟踪方面得到了大量的应用[18,19,20,21]。观测模型根据不同的实现算?
1绪论11学习判别显著性映射。Wang等人基于VGGNet-16[80]的特征,使用全连通CNN构建了回归模型。这些方法在利用大量辅助数据进行离线学习有效特征表示时显示出了有竞争性的对象跟踪结果,也不要完全考虑在后续帧的目标对象的相似的局部结构和内部之间的几何布局信息,这有利于在跟踪过程中从复杂背景中有效地区分视觉跟踪目标。a.目标形变b.光照变化c.突然运动d.背景杂波e.面外旋转f.面内旋转g.严重遮挡h.视野外图1.3复杂场景下对象外观变化的特点及挑战Fig.1.3Featuredchallengescausedbysignificantappearancevariationsincomplexscene
【参考文献】:
期刊论文
[1]融合峰旁比和帧差均值自适应模型更新的视觉跟踪[J]. 熊昌镇,车满强,王润玲,卢颜. 光子学报. 2018(09)
本文编号:3407232
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:110 页
【学位级别】:博士
【部分图文】:
对象跟踪的六种典型应用
1绪论31.2视觉对象跟踪系统结构对象跟踪的基本方法是给定第一帧中一般目标对象的初始状态(如位置和尺度),或者使用对象识别方法(例如,人脸[1]或行人[2]检测器)检测出第一帧中包含的对象的初始状态。利用对象跟踪算法在下一帧中产生众多候选框,并提取这些候选框的特征,在提取的特征基础上对这些候选框进行评分,最后找一个得分最高的候选框作为预测的目标。在图1.2中,我们展示了一个视觉对象跟踪的典型结构。概况起来,一个典型的视觉对象跟踪系统[3,4,5]一般由五个模块组成:(1)运动模型:产生候选样本。(2)外观建模:提取有效特征表示目标。(3)观测模型:为候选样本进行评分。(4)模型更新:更新观测模型使其适应目标的变化。(5)集成方法:结合多个预测获得最优的决策结果。运动模型生成候选样本的速度与质量直接决定了跟踪系统表现的优劣。运动模型可以表示为一个经典的动态状态估计问题:=(,)和=(,),其中 为当前状态, 为当前观测;为状态演化函数,为演化过程噪声; 为测量函数, 为测量噪声。估计的目标是计算给定观测数据的隐藏状态的最优估计,而运动估计则可作为贝叶斯规则[6]的递归形式导出。典型运动模型包括线性回归技术[7]、卡尔曼滤波器[8]、粒子滤波器[9,10]或相关滤波器[11]。外观建模通过不同类型的判别特征构建健壮的外观描述符。在以前的研究中,大量手工制作的特征模型被用来表示目标外观。如子空间表示[12]、颜色直方图[13]、方向梯度直方图(HOG)、哈尔特征(Haar)[14]、SURF[15]、ORB[16]和SuperPixels[17]。近年来,这些特性模型依靠深度卷积神经网络有了显著的进展,在视觉跟踪方面得到了大量的应用[18,19,20,21]。观测模型根据不同的实现算?
1绪论11学习判别显著性映射。Wang等人基于VGGNet-16[80]的特征,使用全连通CNN构建了回归模型。这些方法在利用大量辅助数据进行离线学习有效特征表示时显示出了有竞争性的对象跟踪结果,也不要完全考虑在后续帧的目标对象的相似的局部结构和内部之间的几何布局信息,这有利于在跟踪过程中从复杂背景中有效地区分视觉跟踪目标。a.目标形变b.光照变化c.突然运动d.背景杂波e.面外旋转f.面内旋转g.严重遮挡h.视野外图1.3复杂场景下对象外观变化的特点及挑战Fig.1.3Featuredchallengescausedbysignificantappearancevariationsincomplexscene
【参考文献】:
期刊论文
[1]融合峰旁比和帧差均值自适应模型更新的视觉跟踪[J]. 熊昌镇,车满强,王润玲,卢颜. 光子学报. 2018(09)
本文编号:3407232
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3407232.html
最近更新
教材专著