复杂背景下基于深度学习单目标跟踪技术研究
发布时间:2021-03-27 19:20
近几年,随着图像处理器(GPU)技术越发成熟,深度学习在图像处理众多任务中均取得突破性进展。其中基于深度学习的目标检测算法和目标跟踪算法发展十分迅速。目标跟踪算法因尺度变化、遮挡、背景复杂、目标消失等原因提高跟踪难度,甚至导致跟踪失败。为解决这个问题,本文主要基于深度学习的目标检测算法和基于深度学习目标跟踪算法进行研究,研究内容包括:本文构建用于检测的无人机数据集。为提高数据集小尺度无人机检测精度,本文首先结合残差模块思想改进SSD目标检测算法。本文利用残差网络优化目标检测模型的深度,随着检测网络模型的深度增加,特征信息变得更加多样化,且残差结构使得网络的输出对输入变化更为敏感,所以改进算法针对小尺度无人机目标的检测精度有明显提高。其次本文基于轻量级神经网络MobileNetV2改进目标检测算法,在MobileNetV2的基础上额外添加卷积模块来对目标进行检测,MobileNetV2中使用深度可分离卷积和反向残差结构,其有效减少模型的参数量,提高模型的检测速度。之后,提出一种应用于复杂背景视频中的基于轻量级目标检测算法矫...
【文章来源】:燕山大学河北省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
内在变化影响因素(3)快速运动
随着光照强度的变化,导致图像在成像的不同, 如图1-2 a)所示。光照变化是一种不可抗的干扰因素,提高跟踪模型对光照变化的鲁棒性,是急需解决的问题。(2) 背景混杂背景混杂主要是指运动目标在持续运动过程中,目标与周围背景区域在形态、轮廓、颜色、纹理等方面非常相似,这会对目标跟踪模型造成干扰。如图 1-2 b)所示,背景和目标区域像素值相似,没有明显的区分,这使跟踪时发生漂移现象,而解决背景混杂造成的影响,可以利用目标运动信息,预测目标大致的运动轨迹。(3) 遮挡和超出视野
图 2-6 局部连接原理图2.3.3 池化以卷积神经网络中的第一个卷积层为例,将一张大小 227×227 图像输入卷积层,该卷积层的卷积核大小为 7×7,步长为 2,通道数为 96,那么每个通道得到111×111(( 227- 7)/2+1=111 )大小的特征图,如果用 3×3 的区域进行特征映射,就会得到约 12K(( 111- 3 +1) (111- 3+1)) 维度的图像特征,那么 96 个通道的特征联合起来将产生 1100K 维的卷积特征向量,这样的参数量的模型受限于计算机的硬件设备。池化层在最初时被称为下采样,与信号处理中的下采样一样,用来减少参数量。卷积神经网络中的池化层具体运算与卷积层相同,在其在运算时所占用的参数空间远远少于卷积运算时的参数量。这是因为池化层没有参数,它通过将某个区域的特征统计特征来替代某个位置的输出。这样如果区域内的某些值发生少量的变化,或者图像作出少量旋转、平移或伸缩,池化后的结果不会发生变化。所以池化层除可以
【参考文献】:
期刊论文
[1]深度学习在视频目标跟踪中的应用进展与展望[J]. 管皓,薛向阳,安志勇. 自动化学报. 2016(06)
硕士论文
[1]基于MeanShift的视频目标跟踪算法研究[D]. 张铁明.燕山大学 2016
本文编号:3104067
【文章来源】:燕山大学河北省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
内在变化影响因素(3)快速运动
随着光照强度的变化,导致图像在成像的不同, 如图1-2 a)所示。光照变化是一种不可抗的干扰因素,提高跟踪模型对光照变化的鲁棒性,是急需解决的问题。(2) 背景混杂背景混杂主要是指运动目标在持续运动过程中,目标与周围背景区域在形态、轮廓、颜色、纹理等方面非常相似,这会对目标跟踪模型造成干扰。如图 1-2 b)所示,背景和目标区域像素值相似,没有明显的区分,这使跟踪时发生漂移现象,而解决背景混杂造成的影响,可以利用目标运动信息,预测目标大致的运动轨迹。(3) 遮挡和超出视野
图 2-6 局部连接原理图2.3.3 池化以卷积神经网络中的第一个卷积层为例,将一张大小 227×227 图像输入卷积层,该卷积层的卷积核大小为 7×7,步长为 2,通道数为 96,那么每个通道得到111×111(( 227- 7)/2+1=111 )大小的特征图,如果用 3×3 的区域进行特征映射,就会得到约 12K(( 111- 3 +1) (111- 3+1)) 维度的图像特征,那么 96 个通道的特征联合起来将产生 1100K 维的卷积特征向量,这样的参数量的模型受限于计算机的硬件设备。池化层在最初时被称为下采样,与信号处理中的下采样一样,用来减少参数量。卷积神经网络中的池化层具体运算与卷积层相同,在其在运算时所占用的参数空间远远少于卷积运算时的参数量。这是因为池化层没有参数,它通过将某个区域的特征统计特征来替代某个位置的输出。这样如果区域内的某些值发生少量的变化,或者图像作出少量旋转、平移或伸缩,池化后的结果不会发生变化。所以池化层除可以
【参考文献】:
期刊论文
[1]深度学习在视频目标跟踪中的应用进展与展望[J]. 管皓,薛向阳,安志勇. 自动化学报. 2016(06)
硕士论文
[1]基于MeanShift的视频目标跟踪算法研究[D]. 张铁明.燕山大学 2016
本文编号:3104067
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3104067.html