深度学习及其在视频目标跟踪中的应用研究
发布时间:2021-01-06 21:13
近些年,深度学习在计算机视觉领域取得的突破,使其研究日益受到人们的关注。目前,深度学习中最重要的基础模型结构——卷积神经网络在实际应用当中还存在着泛化能力差、计算复杂度高等问题。本文立足于深度学习算法及其在目标跟踪中的应用研究,主要工作如下:(1)基于国内外关于深度学习算法及其在目标跟踪上的研究发展,对卷积神经网络模型和目标跟踪技术现存的问题进行了分析。(2)研究了深度学习网络中的池化层设计问题。池化层是深度卷积神经网络结构中的一个基础部分,各种池化算法中,随机池化具有较强的抗过拟合能力,随着各种提升卷积神经网络性能的具有负值响应激活函数的出现,传统的随机池化方法已无法适用。针对随机池化无法适用于负值响应激活函数的问题,我们提出一种通用随机池化方法——域偏移最小值法。该方法对于ReLU,虽然不严格等效于原始方法,但是能保持性能不变甚至略有改善。实验表明:所提出的随机池化方法能很好地适用于具有负值响应激活函数,便于设计相应的深度神经网络。(3)研究了随机池化在目标跟踪卷积神经网络中的设计问题。卷积神经网络是目标跟踪任务中特征提取的重要部分,实际目标跟踪任务中要求卷积神经网络在保证较高准确...
【文章来源】:南京邮电大学江苏省
【文章页数】:90 页
【学位级别】:硕士
【部分图文】:
早期LeNet-5结构
分类网络只是四层的全连接网络,对目标的特征刻画能力还是不够优秀,使得总体效果还是低于传统以人工特征为基础的目标跟踪算法,如 Struck[23]等;在线模型更新限定阈值的选取较为敏感,当选取过小,目标表观发生变化时很容易造成模型得不到及时更新,当选取过大,很容易造成遮挡对象或背景被误认为是跟踪对象,从而导致目标漂移。2.3.2 基于卷积神经网络的目标跟踪方法SO-DLT[37](Structured Output Deep Learning Tracker)是 2015 年王乃岩在 DLT 算法的基础上改进得到,该算法继承了 DLT 利用非跟踪数据离线预训练加上在线跟踪微调的策略以解决跟踪过程中训练数据不充足的问题,同时,也对 DLT 存在的一些问题进行了很大的改进。首先在离线预训练阶段,SO-DLT 使用卷积神经网络来学习区分物体和非物体的通用物体特征,即从实例中学习物体的概念。该算法针对目标跟踪问题设计了具有针对性的卷积神经网络结构如图 2.10 所示,
南京邮电大学硕士研究生学位论文 第二章 深度学习的相关技术与应用SO-DLT 离线预训练得到的卷积神经网络模型学习到的是通用物体特征,因为 ImageNet中的图像与实际跟踪的图像不同,所以在线跟踪对于 SO-DLT 跟踪器的性能是必不可少的。SO-DLT 在线跟踪过程如图 2.11 所示,当处理第 t 帧时,以前一帧(第 t-1 帧)预测位置为中心,开始以最小的尺度不断递增式地裁剪输入到网络中,当网络输出的概率图总和高于设定的阈值时,停止裁剪,并以当前裁剪的尺度作为最佳的搜索区域大小。当选定好第 t 帧的最佳搜索区域后,在该区域输出的概率图上利用一定的策略确定最终目标框的位置和尺度大小。在模型在线更新方面,一般如果跟踪器模型不经常更新,可能无法很好地适应目标物体发生的表观变化;如果过于经常更新,不准确的结果可能会损害跟踪器的性能。所以 SO-DLT 在模型在线更新方面,如图 2.11,使用两个 CNN——CNNS与 CNNL,两者最后的结果会进行结合,取置信度最高的作为输出结果,使用两种 CNN 的做法能在适应目标表观变化和漂移间达到均衡。
本文编号:2961267
【文章来源】:南京邮电大学江苏省
【文章页数】:90 页
【学位级别】:硕士
【部分图文】:
早期LeNet-5结构
分类网络只是四层的全连接网络,对目标的特征刻画能力还是不够优秀,使得总体效果还是低于传统以人工特征为基础的目标跟踪算法,如 Struck[23]等;在线模型更新限定阈值的选取较为敏感,当选取过小,目标表观发生变化时很容易造成模型得不到及时更新,当选取过大,很容易造成遮挡对象或背景被误认为是跟踪对象,从而导致目标漂移。2.3.2 基于卷积神经网络的目标跟踪方法SO-DLT[37](Structured Output Deep Learning Tracker)是 2015 年王乃岩在 DLT 算法的基础上改进得到,该算法继承了 DLT 利用非跟踪数据离线预训练加上在线跟踪微调的策略以解决跟踪过程中训练数据不充足的问题,同时,也对 DLT 存在的一些问题进行了很大的改进。首先在离线预训练阶段,SO-DLT 使用卷积神经网络来学习区分物体和非物体的通用物体特征,即从实例中学习物体的概念。该算法针对目标跟踪问题设计了具有针对性的卷积神经网络结构如图 2.10 所示,
南京邮电大学硕士研究生学位论文 第二章 深度学习的相关技术与应用SO-DLT 离线预训练得到的卷积神经网络模型学习到的是通用物体特征,因为 ImageNet中的图像与实际跟踪的图像不同,所以在线跟踪对于 SO-DLT 跟踪器的性能是必不可少的。SO-DLT 在线跟踪过程如图 2.11 所示,当处理第 t 帧时,以前一帧(第 t-1 帧)预测位置为中心,开始以最小的尺度不断递增式地裁剪输入到网络中,当网络输出的概率图总和高于设定的阈值时,停止裁剪,并以当前裁剪的尺度作为最佳的搜索区域大小。当选定好第 t 帧的最佳搜索区域后,在该区域输出的概率图上利用一定的策略确定最终目标框的位置和尺度大小。在模型在线更新方面,一般如果跟踪器模型不经常更新,可能无法很好地适应目标物体发生的表观变化;如果过于经常更新,不准确的结果可能会损害跟踪器的性能。所以 SO-DLT 在模型在线更新方面,如图 2.11,使用两个 CNN——CNNS与 CNNL,两者最后的结果会进行结合,取置信度最高的作为输出结果,使用两种 CNN 的做法能在适应目标表观变化和漂移间达到均衡。
本文编号:2961267
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2961267.html