基于深度卷积神经网络的真实场景物体检测算法研究
发布时间:2021-10-21 00:50
物体检测技术旨在识别并定位图像中的物体,是机器视觉领域中的一个核心研究问题,同时也是人工智能的一个重要组成部分,一直是学术界和工业界的重点研究课题之一。虽然经过了几十年的发展,目前的物体检测算法大多仅是在实验室摆拍图像上的检测效果表现良好,但是在复杂世界的真实场景中,需要依赖有标注信息的图像来训练一个物体检测网络,其检测效果远远不能令人满意。同时,对于真实场景下的小物体(面积小于32*32像素)检测问题,尚处于对特定问题设计特定算法的阶段,对真实场景下复杂多变的工作环境的自适应能力较差。针对上述问题,本文围绕稀缺/稀疏训练数据驱动下的物体检测算法、小物体特征提取方法以及小物体检测算法框架等方面展开研究,对如何提高物体检测算法对环境的自适应能力、灵活性以及如何提高物体检测的准确性提出了新的方法和建议,对物体检测技术从实验室到实际应用起到了一定的推动作用。本文的主要研究内容概括如下:(1)针对已有基于深度卷积神经网络的物体检测算法都依赖大型数据集训练检测网络的问题,而构建大型数据集是一个费时耗力的巨型工程,提出了一种基于伪真值搜寻法的弱监督物体检测算法。其中,针对现存相关算法存在的定位不准...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:154 页
【学位级别】:博士
【部分图文】:
物体检测示意图
哈尔滨工业大学工学博士学位论文-6-深层本质特征,使得相关研究人员可以利用计算机更好地实现类似于人类的视觉感知能力。此外,相比于传统的人工神经网络结构,深度卷积神经网络结构具有两大特点:局部连接和权值共享。其中,局部连接是指在网络特征层上的每个神经元的输入只与前一层的局部区域(局部感受野)相连接,而不是输入图像的全部区域。权值共享是指在每次提取特征时,卷积核的参数是固定不变的。上述这两个特征大大减少了网络参数的数目,降低了网络模型的复杂度,使得深度卷积神经网络更加类似于人类的神经结构。此外,深度卷积神经网络还引入了一些新的方法和概念。综上所述,相对于传统的多层神经网络,深度卷积神经网络有如下特点:(1)深度卷积神经网络在网络中加入了特征学习的能力,输入是信号/图像,而传统多层神经网络输入的是手工特征。(2)深度卷积神经网络引入了“局部感受野”和“权值共享”的概念,极大地减少了网络参数的数量。(3)深度卷积神经网络引入了新的激活函数、损失函数和过拟合方法等等,解决了网络层数过多时存在的梯度消失的问题。(4)深度卷积神经网络采用了新的layer-wise训练机制,提出了逐层初始化的方法,而不是传统多层神经网络中的随机初始化方式。图1-2人工神经网络与人类大脑神经元的类比Fig.1-2Ananalogybetweenartificialneuralnetworksandhumanneurons
第1章绪论-7-深度卷积神经网络是一个包含多个中间层的神经网络,其中每个中间层由多个并行的特征平面组成,而每个特征平面中又包含若干个独立的神经元。如图1-3所示,I表示输入的图像数据,C为基于卷积操作的特征提取层(又叫卷积层),S是特征映射层(又称之为池化层),期间提取的特征用N个全连接层相连接,O为网络最终的输出结果。其中,深度卷积的数学定义为:(,)()(,)(,)(,)mnSijI*KijIimjnKmn(1-1)其物体意义为以尺寸为(m,n)的卷积核K在输入图像I滑动计算卷积值。图1-3深度卷积神经网络结构图Fig.1-3Architectureofthedeepconvolutionalneuralnetwork深度卷积神经网络的训练过程如图1-4所示,包括前向传播过程和反向传播过程。输入图像数据通过输入层传入到卷积神经网络中,经过中间层的非线性拟合关系的处理后,输出最终结果的这个过程称之为前向传播过程。每次前向传播迭代完成后,需要计算输出结果与真值之间的偏差,如果偏差大于一定的阈值,需要对网络参数的权值做进一步地调整,这一过程叫做反向传播过程。假设输入数据为12{,,...,}inPppp,对应的输出真值为12{,,...,}inYyyy,训练过程中深度卷积神经网路的输出()ihp(其中h为深度卷积神经网络的数学模型)可以尽量逼近真值iy,为此,需要定义一个损失函数(目标函数):1()(())niiiJxLhpy(1-2)其中,L()是损失函数的具体类型。训练深度卷积神经网络的过程就是求取网络参数x最优解的过程,而梯度下降法(GradientDescent)是无约束最优化问题求解最常用的一种方法,计算过程为每次迭代时都求解损失函数梯度方向,然后沿着梯度的反方向使得损失函数J(x)达到最小值点,其数学表达式为:min()nxRJx(1-3)梯度下降算法本质是一种迭代方法,
本文编号:3447920
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:154 页
【学位级别】:博士
【部分图文】:
物体检测示意图
哈尔滨工业大学工学博士学位论文-6-深层本质特征,使得相关研究人员可以利用计算机更好地实现类似于人类的视觉感知能力。此外,相比于传统的人工神经网络结构,深度卷积神经网络结构具有两大特点:局部连接和权值共享。其中,局部连接是指在网络特征层上的每个神经元的输入只与前一层的局部区域(局部感受野)相连接,而不是输入图像的全部区域。权值共享是指在每次提取特征时,卷积核的参数是固定不变的。上述这两个特征大大减少了网络参数的数目,降低了网络模型的复杂度,使得深度卷积神经网络更加类似于人类的神经结构。此外,深度卷积神经网络还引入了一些新的方法和概念。综上所述,相对于传统的多层神经网络,深度卷积神经网络有如下特点:(1)深度卷积神经网络在网络中加入了特征学习的能力,输入是信号/图像,而传统多层神经网络输入的是手工特征。(2)深度卷积神经网络引入了“局部感受野”和“权值共享”的概念,极大地减少了网络参数的数量。(3)深度卷积神经网络引入了新的激活函数、损失函数和过拟合方法等等,解决了网络层数过多时存在的梯度消失的问题。(4)深度卷积神经网络采用了新的layer-wise训练机制,提出了逐层初始化的方法,而不是传统多层神经网络中的随机初始化方式。图1-2人工神经网络与人类大脑神经元的类比Fig.1-2Ananalogybetweenartificialneuralnetworksandhumanneurons
第1章绪论-7-深度卷积神经网络是一个包含多个中间层的神经网络,其中每个中间层由多个并行的特征平面组成,而每个特征平面中又包含若干个独立的神经元。如图1-3所示,I表示输入的图像数据,C为基于卷积操作的特征提取层(又叫卷积层),S是特征映射层(又称之为池化层),期间提取的特征用N个全连接层相连接,O为网络最终的输出结果。其中,深度卷积的数学定义为:(,)()(,)(,)(,)mnSijI*KijIimjnKmn(1-1)其物体意义为以尺寸为(m,n)的卷积核K在输入图像I滑动计算卷积值。图1-3深度卷积神经网络结构图Fig.1-3Architectureofthedeepconvolutionalneuralnetwork深度卷积神经网络的训练过程如图1-4所示,包括前向传播过程和反向传播过程。输入图像数据通过输入层传入到卷积神经网络中,经过中间层的非线性拟合关系的处理后,输出最终结果的这个过程称之为前向传播过程。每次前向传播迭代完成后,需要计算输出结果与真值之间的偏差,如果偏差大于一定的阈值,需要对网络参数的权值做进一步地调整,这一过程叫做反向传播过程。假设输入数据为12{,,...,}inPppp,对应的输出真值为12{,,...,}inYyyy,训练过程中深度卷积神经网路的输出()ihp(其中h为深度卷积神经网络的数学模型)可以尽量逼近真值iy,为此,需要定义一个损失函数(目标函数):1()(())niiiJxLhpy(1-2)其中,L()是损失函数的具体类型。训练深度卷积神经网络的过程就是求取网络参数x最优解的过程,而梯度下降法(GradientDescent)是无约束最优化问题求解最常用的一种方法,计算过程为每次迭代时都求解损失函数梯度方向,然后沿着梯度的反方向使得损失函数J(x)达到最小值点,其数学表达式为:min()nxRJx(1-3)梯度下降算法本质是一种迭代方法,
本文编号:3447920
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3447920.html