当前位置:主页 > 科技论文 > 自动化论文 >

基于目标表征学习和更新建模的视频跟踪技术研究

发布时间:2020-04-11 14:18
【摘要】:目标跟踪是计算机视觉中的一项基本任务,旨在获取视频序列中特定目标的状态,包括位置、大小等信息。它有许多潜在的应用,例如在自动驾驶中实时感知周围的物体、监控视频分析中自动追踪可疑的目标及视频编辑中辅助提取感兴趣的区域。经过数十年的研究,目标跟踪领域取得了一些成功。但是,在处理复杂的测试视频时,跟踪算法的表现往往并不尽如人意。比如当目标形变比较大时,跟踪算法返回的边界框与目标实际的形状相比相差比较大。此外,在测试序列较长时,跟踪算法往往由于持续地进行模型更新使模型降质进而导致跟踪失败。这两个问题,即目标表示不精确及模型非最优更新,会严重影响跟踪算法的性能,因此本文主要围绕这两个问题展开研究工作并提出一些解决方案。针对目标表示不精确的问题,本文提出使用二值掩模作为网络的输出,并在其上估计一个多自由度的矩形框作为相对精确的跟踪结果。在生成用以微调网络参数的训练样本时,本文使用Crop and Paste数据增强方法来尽可能地利用背景信息、添加一个随机值到训练样本的亮度分量里来模拟光照变化、以及利用高斯滤波的方式来模拟模糊情形。在估计矩形框时,本文提出了一种利用视频帧之间时间相关性的目标边界框估计方法。该方法估计的边界框含有五个自由参数,比之前跟踪方法中估计的矩形框多两个自由参数,因此本文中的矩形框对目标的表示更为精确。实验表明本文的方法在实时性方法中达到了最好的性能。针对模型非最优更新的问题,本文提出了一个一定程度上进行最优模型更新的最小化目标式。在该目标式中,存在着两项挑战。其一是新生成的目标模型不可靠。为了解决这个问题,式中使用一个惩罚项来限制学习到的目标模型到历史最近的模型之间的距离。其二是随着跟踪的持续进行,目标模型可能会发生降质。为了应对这个难题,式中使用了一个重初始化项。此外,为了控制变换矩阵的复杂度,目标式中还加入了正则化项。该最小化目标式的解,在一些简化的情况下,会退化到指数滑动平均(EMA)。这表明本文的方法可以视作EMA的一种扩展。最后,在一些常用数据集上的实验验证了本文提出的模型更新方法在相对长时情景下的有效性。总结而言,本文提出使用掩模表示网络的输出,并基于该输出估计一个多自由度的矩形框来改善之前跟踪方法中目标表示不精确的问题。除此之外,本文还提出了一个正则化和重初始化的最小化目标式来解决长时情景中模型非最优更新的问题。
【图文】:

目标表示,示例,问题,宽高比


虽然经过学术界与工业界的共同努力,目标跟踪领域取得了一些成功,但是逡逑它仍面临着一些挑战。其一是视频序列中的目标外形复杂多变,固定宽高比及逡逑旋转角度的矩形框不能较好地包裹住目标,如图1.1所示。测试视频序列中的目逡逑标,,随着时间的流逝,它的宽高比及在平面内的旋转角度会发生变化。此时若估逡逑计的矩形框一味地沿用初始帧中目标的宽高比及平面内旋转角度,则它将不能逡逑很好地分界目标与非目标区域,即在包裹尽可能多的前景像素的同时包裹尽可逡逑能少的背景像素。然而,现在多数的跟踪方法往往采用了上述做法,即沿用初始逡逑帧中目标的宽高比及旋转角度。这导致这些跟踪方法估计的矩形框很不精确。逡逑其二是长时情景中的模型非最优更新问题。长时跟踪情景中,因为目标的外逡逑观会逐渐变化,所以进行模型更新是必要的。但是,若随着跟踪的进行持续地更逡逑新模型,模型会由于一些严重的污染例如模糊和遮挡等或者小的错误累积而退逡逑化降质。目标模型退化降质以后

宽高比,目标矩形,分割模型,目标跟踪


要一个叫做矩形框估计器1481的额外模块。后者则需要一组启发式的阈值。为了逡逑简化,这些工作都假定目标矩形框的宽高比和旋转角度不变。然而,这种假定在逡逑多数实际的测试视频中是不合理的,参见图2.1。逡逑为了解决上述局限,本文提出使用掩模作为CNN的输出表示。为了这个目逡逑标,本文直接使用一个主流的语义分割模型DeepLablW作为基础模型,并通过逡逑在线学习的方式将之迁移到目标跟踪任务上。在监督网络训练的时候,经典的逡逑语义分割模型需要逐像素的标签,然而这种精细的信息在目标跟踪任务标准的逡逑设置中是得不到的。在标准的设置中,所能得到的信息就仅仅只有视频初始帧逡逑中给定的目标矩形框11]。为了得到逐像素的标签,之前传统的追求像素级跟踪结逡逑果的方法或者依靠一个外部算法[71],例如或者需要一个被阈值化逡逑的由他们的概率模型生成的置信图[72]。但是
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP18

【相似文献】

相关期刊论文 前10条

1 石武祯;宁纪锋;颜永丰;;压缩感知跟踪中的特征选择与目标模型更新[J];中国图象图形学报;2014年06期

2 刘亚娟;庄肖波;;基于选择性模型更新与卡尔曼滤波的目标模型更新算法[J];科学技术与工程;2012年34期

3 黄安奇;侯志强;余旺盛;刘翔;;利用背景加权和选择性子模型更新的视觉跟踪算法[J];中国图象图形学报;2014年09期

4 黑石头;;邪神的爪牙——战锤混沌战士[J];模型世界;2008年12期

5 黎明;计春雷;;基于支持向量机的彩色序列图像复原模型更新算法[J];上海电机学院学报;2009年04期

6 杨惠兰;谢毅;赵雪汝;张维;何先友;;事件持续时间对情景模型更新的影响[J];心理科学;2016年02期

7 钟怀兵;熊伟丽;徐保国;;一种带模型更新的GPR在线软测量方法[J];控制工程;2018年02期

8 沈志熙;杨欣;黄席樾;;均值漂移算法中的目标模型更新方法研究[J];自动化学报;2009年05期

9 张亚X;高学金;曹彩霞;李亚芬;王普;;一种带有模型更新机制的JITL-MPLS故障监测方法[J];计算机与应用化学;2018年06期

10 王英杰;焦彬洋;姚忠达;时瑾;;基于实测数据的车轨耦合模型更新方法[J];振动.测试与诊断;2018年02期

相关会议论文 前3条

1 谢毅;王靖;何先友;;文本阅读中时间转换的加工和监测[A];第十五届全国心理学学术会议论文摘要集[C];2012年

2 李波;袁保宗;;LMSF Mean Shift目标跟踪算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年

3 韩正之;;HAC合成过程的建模[A];1997年中国控制会议论文集[C];1997年

相关博士学位论文 前7条

1 杨格;基于控制点和本构模型更新的混合试验方法及平台实现[D];哈尔滨工业大学;2018年

2 李远征;人体目标跟踪和表情识别中的若干问题研究[D];西安电子科技大学;2013年

3 郭甲腾;地矿三维集成建模与空间分析方法及其应用[D];东北大学;2013年

4 陈永盛;基于截面屈服面模型更新的框架结构混合试验方法[D];哈尔滨工业大学;2015年

5 蒋良卫;图像序列中目标跟踪技术研究[D];华中科技大学;2013年

6 王涛;基于模型更新的土木结构混合试验方法[D];哈尔滨工业大学;2014年

7 伍博;基于显著性的视觉目标跟踪研究[D];电子科技大学;2017年

相关硕士学位论文 前10条

1 黄江雷;基于目标表征学习和更新建模的视频跟踪技术研究[D];中国科学技术大学;2019年

2 陈令奕;近红外模型更新方法及在食品检测中的应用[D];江南大学;2018年

3 杨治国;视频监控中行人检测与跟踪的算法研究[D];湖南大学;2015年

4 郭东生;农产品品质检测模型更新方法研究[D];江南大学;2018年

5 刘阳;基于多模型框架的跟踪算法研究[D];华中科技大学;2017年

6 刘桐;针对样本选择和模型控制的跟踪算法研究[D];天津大学;2017年

7 李永s

本文编号:2623687


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2623687.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户32257***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com