基于孪生深度网络与元学习的视觉目标跟踪算法研究

发布时间:2021-01-30 14:10
  近年来,人工智能的发展异常迅猛,作为视频与图像序列智能化分析处理的最重要方式之一,视觉目标跟踪逐渐成为了计算机视觉领域中一大热门研究方向,在诸如交通监管、无人驾驶、智能导航、人机交互甚至军事领域等大量场景下均拥有广阔的发展与应用前景。由于自然拍摄环境下存在诸多干扰,目标跟踪算法面临包括形变、旋转、被遮挡、尺度变换、光照变化、运动模糊、相似物体干扰等各种困难与挑战。本文基于孪生结构的卷积神经网络构建的视觉目标跟踪算法模型,利用基于元学习梯度下降的训练优化方法,提高了跟踪模型在面临自然场景各类干扰挑战时跟踪的精确度与鲁棒性,并结合视频文字跟踪任务,针对其难点做出相应改进,实现跟踪模型在文本场景中的应用。本文主要贡献包括以下几点:1、在目前孪生网络跟踪模型基础上,提出了一种新的基于元学习梯度更新的目标跟踪算法,通过对回归分支的卷积核参数的内部优化,充分利用模板帧目标坐标监督信息,使得跟踪模型可以更准确地拟合目标位置坐标。2、采用了模型无关元学习法的训练方案对参数进行更新,得到的模型在面对新的跟踪视频时仅通过对第一帧图像的一次或少量几次梯度下降,就得到能够适应当前视频的最优模型参数,实现对当前... 

【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校

【文章页数】:78 页

【学位级别】:硕士

【部分图文】:

基于孪生深度网络与元学习的视觉目标跟踪算法研究


SiameseFC网络结构

网络结构图,网络结构,区域


图 2-2 候选区域生成网络结构[38]PN 通常用于提取感兴趣区域,若某个区域的得分大于一定阈值,即可像属于分类任务中的某一类,网络会将所有可能包含物体的区域选取出被称为 ROI(Region of Interests),每个 ROI 在特征图上都有对应位ing Box,回归分支的作用就是对这些坐标框进行修正。ROI 的生成过程测图片每个像素为中心生成 个大小预设定框(Anchor),通过分类分别是否被包含在框内,再通过回归分支对 Anchor 的位置( )和大小,根据偏移量( )即可计算得到 Bounding Box,偏移公式 = = = = 里没有直接计算( )的原因是,用回归方式计算的前提是原本 A

基于孪生深度网络与元学习的视觉目标跟踪算法研究


,N4川翻l比胶R喂向.rr月扣,目到创.叮卜


本文编号:3009038

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3009038.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f9c72***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com