基于卷积神经网络的目标跟踪算法研究
发布时间:2021-12-10 13:01
随着高像素成像设备和计算机数据处理的快速发展,计算机视觉领域取得了长足的进步。视觉目标跟踪是计算机视觉和图像处理的重要分支,它在人机交互、自动驾驶、军事、图像目标识别领域中具有广泛的应用。深度学习的出现,解决了很多计算机视觉领域中复杂的问题,在目标检测、图像分割与分类等方面都获得了较好的成绩,而近些年,许多基于深度学习的目标跟踪算法被提出,加快了目标跟踪领域的发展,大大提升了跟踪精度和速度。本文主要对基于卷积神经网络的目标跟踪算法进行分析和研究,利用其优势对现有的算法进行优化和改进,主要的研究内容和创新点如下:本文对目标跟踪算法研究现状进行了一个全面的回顾,了解当前目标跟踪领域所面临的一些挑战,并详细介绍了神经网络,基于卷积特征和相关滤波的目标跟踪方法,基于端到端网络模型的目标跟踪方法,发现了丰富的特征表达以及降低复杂的计算量会使目标跟踪的性能更加鲁棒。(1)为了能够充分提取目标的卷积特征,利用其语义信息,在较为复杂的场景变化中更好的进行跟踪,本文提出了一种基于时空上下文分层响应融合的目标跟踪算法。该算法利用卷积神经网络的分层特征,在卷积层上学习时空上下文感知相关滤波器,通过融合三个卷...
【文章来源】:华侨大学福建省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
目标跟踪过程中的部分挑战
13第2章相关理论基础基于卷积神经网络的目标跟踪方法通常可分为两种,一种是在基于传统算法的基础上结合深度特征的算法,这类算法仅仅把神经网络当作一种特征提取器,不能够发挥出卷积神经网络的全部优势;另一种是使用端到端的神经网络结构进行跟踪的算法,目标的位置和尺度完全由神经网络自己来预测。本文将基于这两种方法进行改进,并提出相应的跟踪算法。在本章中,将会先介绍神经网络的基础,其次对上述两类算法进行讨论。2.1人工神经网络人工神经网络[43]是从生物学中演变而来,基于其神经网络的基本原理,通过理解和抽象人脑的结构以及外界刺激的响应后,以一种网络拓扑的方式展示出来,模拟出人脑的神经系统对于外界信息的处理过程的一种模型。这种模型它有很强的能力,将并行分布的处理能力、自学习、智能化和高容错性等能力作为特征,把各种信息的加工处理和存储结合在一起,并以其优秀的表示方式和智能化的自适应学习能力,在各个学科领域引起了大量研究人员的关注,对它不断进行研究分析改进,提高该网络的效率。它主要由大量的简单元件通过相互连接组成了一个复杂的神经网络,并且它具有较强的非线性能力,能够很好的应对一些复杂的逻辑操作和实现非线性关系。下图2.1展示的是一个3层的神经网络。图2.1人工神经网络模型
15图2.2卷积操作这个过程可以理解为有一个滑动窗口,步长为1,把卷积核与对应的图像像素做乘积然后求和,得到了33的卷积结果,也就是卷积特征。在实际训练过程中,卷积核的值是在学习过程中学到的。在具体应用中,往往有多个卷积核,每个卷积核代表了一种图像模式[45],如果某个图像块与此卷积核卷积出的值大,则认为此图像块十分接近于此卷积核。如果设计了8个卷积核,认为这个图像上有8种底层纹理模式,也就是用8种基础模式就能描绘出一副图像。对于图像,主要采用了卷积的方式来处理,也就是对每个像素点赋予一个权值,这个操作显然是线性的。但是对于绝大多数样本来说,不一定是线性可分的,为了解决这个问题,可以进行线性变化或者引入非线性因素,解决线性模型所不能解决的问题。因此,卷积神经网络中引入了激活函数,常用的激活函数有Sigmoid、Tanh、ReLU、LeakyReLU等等。(2)池化层在卷积层中,可以通过调节步长参数实现特征图的高宽成倍缩小,从而降低了网络的参数量。此外,还有一种专门的网络层可以实现尺寸缩减功能,它就是池化层(PoolingLayer)。池化层直接计算池化窗口内元素的最大值或者平均值,该运算也分别叫做最大池化或平均池化。在最大池化中,池化窗口从输入数组的最左上方开始,按从左往右、从上往下的顺序,依次在输入数组上滑动。当池化窗口滑动到某一位置时,窗口中的输入子数组的最大值即输出数组中相应位置的元素。
【参考文献】:
期刊论文
[1]目标跟踪算法综述[J]. 卢湖川,李佩霞,王栋. 模式识别与人工智能. 2018(01)
[2]视觉导航技术的发展及其研究分析[J]. 王先敏,曾庆化,熊智,刘建业. 信息与控制. 2010(05)
本文编号:3532673
【文章来源】:华侨大学福建省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
目标跟踪过程中的部分挑战
13第2章相关理论基础基于卷积神经网络的目标跟踪方法通常可分为两种,一种是在基于传统算法的基础上结合深度特征的算法,这类算法仅仅把神经网络当作一种特征提取器,不能够发挥出卷积神经网络的全部优势;另一种是使用端到端的神经网络结构进行跟踪的算法,目标的位置和尺度完全由神经网络自己来预测。本文将基于这两种方法进行改进,并提出相应的跟踪算法。在本章中,将会先介绍神经网络的基础,其次对上述两类算法进行讨论。2.1人工神经网络人工神经网络[43]是从生物学中演变而来,基于其神经网络的基本原理,通过理解和抽象人脑的结构以及外界刺激的响应后,以一种网络拓扑的方式展示出来,模拟出人脑的神经系统对于外界信息的处理过程的一种模型。这种模型它有很强的能力,将并行分布的处理能力、自学习、智能化和高容错性等能力作为特征,把各种信息的加工处理和存储结合在一起,并以其优秀的表示方式和智能化的自适应学习能力,在各个学科领域引起了大量研究人员的关注,对它不断进行研究分析改进,提高该网络的效率。它主要由大量的简单元件通过相互连接组成了一个复杂的神经网络,并且它具有较强的非线性能力,能够很好的应对一些复杂的逻辑操作和实现非线性关系。下图2.1展示的是一个3层的神经网络。图2.1人工神经网络模型
15图2.2卷积操作这个过程可以理解为有一个滑动窗口,步长为1,把卷积核与对应的图像像素做乘积然后求和,得到了33的卷积结果,也就是卷积特征。在实际训练过程中,卷积核的值是在学习过程中学到的。在具体应用中,往往有多个卷积核,每个卷积核代表了一种图像模式[45],如果某个图像块与此卷积核卷积出的值大,则认为此图像块十分接近于此卷积核。如果设计了8个卷积核,认为这个图像上有8种底层纹理模式,也就是用8种基础模式就能描绘出一副图像。对于图像,主要采用了卷积的方式来处理,也就是对每个像素点赋予一个权值,这个操作显然是线性的。但是对于绝大多数样本来说,不一定是线性可分的,为了解决这个问题,可以进行线性变化或者引入非线性因素,解决线性模型所不能解决的问题。因此,卷积神经网络中引入了激活函数,常用的激活函数有Sigmoid、Tanh、ReLU、LeakyReLU等等。(2)池化层在卷积层中,可以通过调节步长参数实现特征图的高宽成倍缩小,从而降低了网络的参数量。此外,还有一种专门的网络层可以实现尺寸缩减功能,它就是池化层(PoolingLayer)。池化层直接计算池化窗口内元素的最大值或者平均值,该运算也分别叫做最大池化或平均池化。在最大池化中,池化窗口从输入数组的最左上方开始,按从左往右、从上往下的顺序,依次在输入数组上滑动。当池化窗口滑动到某一位置时,窗口中的输入子数组的最大值即输出数组中相应位置的元素。
【参考文献】:
期刊论文
[1]目标跟踪算法综述[J]. 卢湖川,李佩霞,王栋. 模式识别与人工智能. 2018(01)
[2]视觉导航技术的发展及其研究分析[J]. 王先敏,曾庆化,熊智,刘建业. 信息与控制. 2010(05)
本文编号:3532673
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3532673.html
最近更新
教材专著