基于卷积神经网络的目标跟踪方法研究
发布时间:2022-02-12 04:04
目标跟踪是计算机视觉领域的重要研究方向。因为目标跟踪技术在多个领域都具有举要重要应用价值,所以目标跟踪是目前计算机视觉研究的热点。本文通过近几年的目标跟踪方法进行分析研究,得出两个重点研究思路:第一、新的目标跟踪算法普遍将研究重点应该放在如何通过卷积神经网络提取目标的鲁棒性特征上,重点在于加强网络每层特征映射的利用。第二、新的目标跟踪算法可以将研究的目光放在在后续特征处理和目标位置选取上,重点在于提升对网络输出特征的利用。本文以多层卷积网络作为跟踪的特征提取器,以Siamese网络作为跟踪器的基础网络框架,提出了将高频特征和低频特征相互融合的目标跟踪方法。针对现在的多层卷积网络结构,使用残差网络块作为组成特征提取网络的基本结构,然后将目标特征和搜索区域特征的输入分为高频特征和低频特征在不同通道中分别进行处理,并且每层高低频特征输出结果进行信息交换。最终得到的目标特征信息更为丰富,获得了较好的跟踪性能。本文还提出了网格特征点融合的目标跟踪方法。以Siam RPN为基础,对特征提取后的网络部分进行修改。针对Siam RPN的偏移回归分支,通过引入网格点特征融合的方法,通过全卷积定位来优化回...
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
原Siamese网络结构图
重庆邮电大学硕士学位论文第3章高低空间频率特征提取的跟踪方法21(b)SiamRPN+方法图3.2结合高低频特征的SiamFC和SiamRPN的改进方法3.2.3结合高频特征和低频特征的特征提取网络对于普通的卷积,输出和输入的特征具有相同的空间分辨率。Campbell等认为,一副自然图像可以分解出高频信号图像和低频信号图像[42]。高频信号更多地描绘图像的细节信息,而低频信号倾向于表示全局的粗略结构。在目标跟踪中,为了获取低频的特征信息,可以通过额外添加一个下采样的方式,将特征输出缩小,然后将其输出和未做下采样的特征经过同样的卷积核操作。在进行相同次数的卷积核卷积计算后,其输出后的每个点和未做下采样的特征相比,更加粗略,单个点对应的原图像上图像块的大小更大。这样,低频的特征和比其高频的特征具有更大的接受域,对视频图像的总体外观能力比正常的卷积输出特征强。
重庆邮电大学硕士学位论文第3章高低空间频率特征提取的跟踪方法23通过上面的方式,3的卷积部分的接受域是普通卷积的2倍。这进一步帮助每个卷积层从更远的位置获取更多的上下文信息,提高网络特征的性能。3.2.4特征网络改进细节本章方法的主干网络选择的是ResNet网络作为原特征提取器来取代AlexNet。根据ResNet的特点,其网络结构主要为多个相同结构的残差块叠加构成,单个残差块如图3.3所示。图3.3基础ResNet的残差块结构图3.3中,conv1x1和conv3x3表示卷积核长宽为1和3,s1表示卷积核计算时位移步长为1,表示卷积特征的通道数。依照高低频卷积的思路,将backbone结构进行优化。依据功能的不同,修改的残差块分为三个主要的部分,并将其命名为:HL_block,In_block和Out_block。1.HL_block结构此模块是用于作为主要的高低频特征提取网络的结构。根据式(3.6),可以得到改进后的backbone的主要结构。HL_block有两个输入:一个是高频特征输入2,另一个是低频特征输入3。通过卷积计算,HL_block得到两个特征输出,一个为高
本文编号:3621229
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
原Siamese网络结构图
重庆邮电大学硕士学位论文第3章高低空间频率特征提取的跟踪方法21(b)SiamRPN+方法图3.2结合高低频特征的SiamFC和SiamRPN的改进方法3.2.3结合高频特征和低频特征的特征提取网络对于普通的卷积,输出和输入的特征具有相同的空间分辨率。Campbell等认为,一副自然图像可以分解出高频信号图像和低频信号图像[42]。高频信号更多地描绘图像的细节信息,而低频信号倾向于表示全局的粗略结构。在目标跟踪中,为了获取低频的特征信息,可以通过额外添加一个下采样的方式,将特征输出缩小,然后将其输出和未做下采样的特征经过同样的卷积核操作。在进行相同次数的卷积核卷积计算后,其输出后的每个点和未做下采样的特征相比,更加粗略,单个点对应的原图像上图像块的大小更大。这样,低频的特征和比其高频的特征具有更大的接受域,对视频图像的总体外观能力比正常的卷积输出特征强。
重庆邮电大学硕士学位论文第3章高低空间频率特征提取的跟踪方法23通过上面的方式,3的卷积部分的接受域是普通卷积的2倍。这进一步帮助每个卷积层从更远的位置获取更多的上下文信息,提高网络特征的性能。3.2.4特征网络改进细节本章方法的主干网络选择的是ResNet网络作为原特征提取器来取代AlexNet。根据ResNet的特点,其网络结构主要为多个相同结构的残差块叠加构成,单个残差块如图3.3所示。图3.3基础ResNet的残差块结构图3.3中,conv1x1和conv3x3表示卷积核长宽为1和3,s1表示卷积核计算时位移步长为1,表示卷积特征的通道数。依照高低频卷积的思路,将backbone结构进行优化。依据功能的不同,修改的残差块分为三个主要的部分,并将其命名为:HL_block,In_block和Out_block。1.HL_block结构此模块是用于作为主要的高低频特征提取网络的结构。根据式(3.6),可以得到改进后的backbone的主要结构。HL_block有两个输入:一个是高频特征输入2,另一个是低频特征输入3。通过卷积计算,HL_block得到两个特征输出,一个为高
本文编号:3621229
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3621229.html
最近更新
教材专著