复杂场景下的目标跟踪算法研究
发布时间:2017-09-03 08:27
本文关键词:复杂场景下的目标跟踪算法研究
更多相关文章: 目标跟踪 在线学习 稀疏表示 表观模型 模板更新
【摘要】:视觉目标跟踪技术是计算机视觉的重要研究课题之一,它是进行更高层次行为识别和图像语义理解的必要前提,有着广泛的应用背景(比如视频监控、智能交通、机器人导航等)。在跟踪过程中,如何有效地表示目标的表观,同时排除外界环境中的干扰因素(比如姿态变化、形状变化、光照变化、相机运动、目标遮挡等),是视觉跟踪中需要解决的问题。虽然在过去几十年目标跟踪的研究有了很大的发展,但实践表明复杂场景中的运动目标跟踪算法还远未成熟,仍然是一个富有挑战性的课题。针对跟踪过程中存在的困难,本论文在研究了传统目标跟踪算法的基础上,重点对目标表观的建模、模板更新方式、跟踪优化框架等方面进行了深入地研究。论文的主要工作和贡献包括:1)提出了一种基于粒子群优化框架下的目标跟踪算法。该算法考虑了目标的局部信息和不同帧之间SIFT特征点匹配,目标的局部信息能够处理部分遮挡,丢失的目标通过不同帧之间SIFT特征点匹配重新找到。首先将一个目标状态划分为多个不重叠的片段(Patch),每一个片段表示目标不同的部分,同时定义了片段的显著性函数。在跟踪过程中,利用显著值高的片段来对目标跟踪;当目标发生漂移时,通过当前帧图像的SIFT特征与目标模板相匹配来重新找到目标。另外,为了获得更加精确的目标状态,将匹配得到的SIFT特征点的位置信息融入到粒子群算法迭代的结果中。最后对目标模板更新时,只更新片段显著值高的目标模板,而显著值低的片段模板不更新,因此,该算法的更新方式避免了噪声混入到目标模板中造成跟踪质量下降。该算法在一些挑战性的视频数据集上进行了验证,通过对实验结果定性和定量分析说明了该算法的优越性。2)提出了一种等级关联的粒子群迭代多目标检测跟踪算法。针对目标在跟踪过程中受环境变化影响使其跟踪发生偏移的问题,本文提出了一种从目标粗匹配到粒子群算法精确定位的等级关联的多目标跟踪算法。粗匹配阶段,在粒子随机产生过程中融入了上下文信息,通过粒子的标号信息找到当前帧目标与前一帧中的哪个目标相匹配;目标精确定位阶段,通过粒子群迭代优化,找到目标最终的位置。对于有显著偏差的目标位置,采用Metropolis-Hastings采样算法进行纠正,同时完成模板更新。当目标之间发生遮挡时,通过自适应调整不同线索(颜色线索和运动线索)的权重来适应环境的变化,从而继续跟踪目标。实验证明,该方法融入了目标的上下文信息,使得目标匹配的准确度得到了提高,降低了跟踪的目标发生错误跟踪的可能。3)提出了一种基于超像素的在线跟踪算法。本文将超像素作为视觉线索,在此基础上提出了两种跟踪算法:基于超像素的L1跟踪算法(Superpixel-L1 Tracker, SPL1)和加权多示例学习跟踪算法(Weighted Multiple-Instance Learning, WMIL)。对于SPL1算法,通过超像素来构造字典对目标表观建模,然后在粒子滤波的框架下求解每一个粒子(候选目标状态)的L1范数最小化问题。把重构误差最小的候选状态作为跟踪结果。在字典更新过程中,为了减轻目标发生漂移的影响,而保留初始几帧的信息。对于WMIL算法,利用超像素特征建模目标的表观。跟踪过程中,每一个采样粒子依据对跟踪的贡献被赋予一个权重值,然后在多示例学习框架下训练分类器,并把分类值最高的候选目标状态作为目标跟踪的位置。最后,利用加权后得到的正负示例包来更新分类器。仿真结果验证了两种算法在目标发生长时间遮挡、尺度和光照变化时依然能够稳定地跟踪目标。4)提出了一种生成式模型和判别式模型协同的多任务学习跟踪算法。生成式模型忽视了一些对目标判别有用的背景信息,因此,他们在干扰的环境下跟踪目标的效率不高。而判别式方法能够充分利用目标信息和背景信息来分离出目标和背景。本论文使用多任务学习方法来解决目标状态的稀疏问题。首先,每一个候选状态作为一个单独的任务,并在每个状态内依次分割为m个子块。挖掘不同任务之间相应子块的关联信息来获得联合稀疏表示,从而降低了计算代价。其次,针对生成式模型和判别式模型,我们分别定义了两种似然度量准则。生成式模型的似然准则考虑了目标的局部信息;而判别式模型的似然准则考虑了目标的整体信息。在跟踪过程中,两个跟踪模型分别预测目标位置,并且使用一个跟踪器的结果来更新另一个跟踪器的表观模板,这种更新机制避免了单个跟踪模型的自学习问题。另外,采用Metropolis-Hastings采样方法对字典进行更新。最后,在挑战性的视频序列上分析了我们提出的跟踪算法性能,该算法优于其他主流的跟踪算法。5)提出了一种基于显著性检测的多目标跟踪算法。稀疏表示技术由于能够很好地处理噪声的干扰而被用于目标跟踪。同时,稀疏表示方法对多个类别的分类也取得了好的效果。本文将这一技术扩展到跟踪多个目标。首先离线学习显著性检测器,再用该检测器检测每一帧图像中的目标。最大的稀疏系数所对应的字典原子与目标最相似。因此,利用最大稀疏系数的子字典索引找到目标的匹配。其次,我们提出用随机梯度下降方法在线更新字典,并考虑把显著性检测器的字典作为初始字典。将每段视频的前10帧用于训练表观模型,找到字典中的每个原子表示场景中的哪一个目标。字典中不仅包括有目标模板,还有背景信息。另外,目标的局部信息和目标与目标之间的相对位置,以及匹配的特征点与目标之间的相对位置也被用来处理目标的遮挡和跟踪难以分辨的目标。实验结果表明,基于稀疏表示的方法能够降低目标错误匹配的数目,跟踪的性能在一定程度上得到了提高。
【关键词】:目标跟踪 在线学习 稀疏表示 表观模型 模板更新
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要4-6
- Abstract6-13
- 缩略词注释表13-15
- 第一章 绪论15-39
- 1.1 研究背景和意义15-16
- 1.2 国内外研究现状16-17
- 1.3 目标跟踪算法的分类及面临的挑战17-21
- 1.3.1 目标跟踪算法的分类17-20
- 1.3.2 目标跟踪面临的挑战20-21
- 1.4 当前主流目标跟踪算法综述21-32
- 1.4.1 基于粒子滤波的目标跟踪22-23
- 1.4.2 基于均值移动的目标跟踪23-24
- 1.4.3 基于片段的目标跟踪24-25
- 1.4.4 基于子空间的目标跟踪25-27
- 1.4.5 基于稀疏表示的目标跟踪27-29
- 1.4.6 基于判别式模型的目标跟踪29-30
- 1.4.7 基于检测的跟踪方法30-32
- 1.5 目标跟踪算法性能的评价准则32-35
- 1.5.1 单目标跟踪算法的评价准则32-34
- 1.5.2 多目标跟踪算法的评价准则34-35
- 1.6 本文算法评测数据库介绍35-36
- 1.7 论文的主要工作36-37
- 1.8 论文的结构安排37-39
- 第二章 基于粒子群优化的目标跟踪算法39-59
- 2.1 引言39-40
- 2.2 粒子群优化算法40-41
- 2.3 SIFT特征描述子41-43
- 2.4 基于PSO的目标跟踪算法43-48
- 2.4.1 目标运动模型44
- 2.4.2 目标表观模型44-46
- 2.4.3 表观模型更新46-48
- 2.5 实验结果与分析48-56
- 2.5.1 实验环境及参数设置48
- 2.5.2 定性分析48-50
- 2.5.3 定量分析50-52
- 2.5.4 扩展到对多个目标的跟踪52-55
- 2.5.5 计算代价55-56
- 2.6 本章小结56-59
- 第三章 等级关联的粒子群迭代多目标检测跟踪59-71
- 3.1 引言59-60
- 3.2 Metropolis-Hastings采样60-61
- 3.3 问题的描述61-62
- 3.4 等级关联的粒子群迭代多目标检测跟踪算法62-66
- 3.4.1 等级关联结构62-65
- 3.4.1.1 粗匹配阶段63-64
- 3.4.1.2 精确定位阶段64-65
- 3.4.2 漏检目标和遮挡目标的处理65-66
- 3.5 实验结果与分析66-69
- 3.5.1 实验环境的建立及算法的评价准则66
- 3.5.2 实验结果及分析66-68
- 3.5.2.1 遮挡环境下目标数目固定的跟踪结果66-67
- 3.5.2.2 复杂环境下目标数目变化的跟踪结果67-68
- 3.5.3 不同算法跟踪性能的比较68-69
- 3.6 本章小结69-71
- 第四章 基于超像素的在线跟踪71-93
- 4.1 引言71-72
- 4.2 L1范数跟踪及其存在的问题72-73
- 4.3 超像素73
- 4.4 基于超像素的L1跟踪73-78
- 4.4.1 初始字典的生成74-75
- 4.4.2 SPL1算法实现75-76
- 4.4.3 字典的在线更新76
- 4.4.4 SPL1算法步骤及流程76-78
- 4.5 基于超像素的加权多示例学习跟踪78-83
- 4.5.1 系统流程78-79
- 4.5.2 基于超像素的表观模型79
- 4.5.3 在线的加权多示例学习79-81
- 4.5.4 目标漂移的纠正81-82
- 4.5.5 表观模型更新82-83
- 4.6 实验结果与分析83-91
- 4.6.1 定性结果分析84-86
- 4.6.2 定量结果分析86-89
- 4.6.3 Haar-like特征的高效性89-90
- 4.6.4 计算代价分析90-91
- 4.7 本章小结91-93
- 第五章 多任务学习的协同跟踪算法93-111
- 5.1 引言93-94
- 5.2 粒子滤波框架94-95
- 5.3 GDMTT跟踪算法95-102
- 5.3.1 结构性信息的多任务稀疏表示95-96
- 5.3.2 初始字典的生成96-97
- 5.3.3 基于生成式模型的多任务稀疏表示97
- 5.3.4 基于判别式模型的多任务稀疏表示97-98
- 5.3.5 协同定位目标98-99
- 5.3.6 两种跟踪器之间的协同关系99
- 5.3.7 表观模型更新99-101
- 5.3.8 GDMTT算法总结101-102
- 5.4 实验结果与分析102-109
- 5.4.1 实验参数的设置102
- 5.4.2 定量分析102-105
- 5.4.3 定性分析105-108
- 5.4.4 GDMTT算法的计算代价108-109
- 5.5 本章小结109-111
- 第六章 基于显著性检测的多目标跟踪算法111-125
- 6.1 引言111-112
- 6.2 显著性检测器112-113
- 6.3 基于显著性检测的稀疏跟踪算法113-118
- 6.3.1 目标表观模型的表示114
- 6.3.2 不同帧间的目标匹配114-115
- 6.3.3 在线的字典更新115-117
- 6.3.4 目标遮挡和背景干扰的处理117-118
- 6.4 实验结果与分析118-124
- 6.4.1 实验环境的建立118-119
- 6.4.2 定性和定量分析119-123
- 6.4.3 计算速度123-124
- 6.5 本章小结124-125
- 第七章 总结与展望125-129
- 7.1 论文工作总结125-126
- 7.2 后续工作展望126-129
- 致谢129-131
- 参考文献131-145
- 攻读博士学位期间参加的科研项目和完成的论文145-147
本文编号:783934
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/783934.html