交通视频数据在线结构化特征提取研究
发布时间:2021-11-07 03:48
伴随着汽车产业的蒸蒸日上,城市交通问题日益凸显,逐渐影响着经济的发展和社会的进步。随着信息技术时代的到来,人们渴望利用智能交通系统解决交通问题,而交通视频检测正是其最基础和重要的组成部分。传统的目标检测算法依靠人工经验设计特征且抗干扰性差,无法满足实际场景需求。近几年在大数据集快速发展的背景下,深度学习给模式识别任务提供了新的思路,利用深度卷积神经网络自动学习目标特征以进行视频中交通目标的实时检测,为智能交通系统解决交通问题提供数据和技术支持。考虑到现实中基于交通视频数据的每一帧图像里包含多个类别图像的数据集相对较少,因此根据唐山的交通流现状创建了交通目标检测数据集,重点研究了数据采集、数据增强和数据标定,然后将数据转换成Tensor Flow深度学习框架可接受的预训练格式。对两阶段目标检测算法和一阶段目标检测算法的原理和算法性能进行分析,以检测准确率和检测速度为衡量标准,选择能同时兼顾准确率和检测速度的SSD算法。通过对SSD算法的超参数进行微调,提高交通目标检测的准确率,使训练好的SSD模型在晴天和雨天等情况下均能取得不错的检测效果。在有效视野中,检测算法在目标检测和目标分类上的准...
【文章来源】:华北理工大学河北省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
卷积神经网络结构示意图
华北理工大学硕士学位论文-16-世界上所有的颜色都是由三原色红、绿、蓝相互变化以及相互之间的叠加来得到的,因此一张RGB格式的彩色图片也是由红、绿、蓝三个分量叠加所组成。将彩色图片输入到神经网络里,网络看不到图像里的物体,网络能看到的只是一些像素值。图5所示是分量卷积核对输入图像红、绿、蓝三个分量像素值的卷积结果。图5卷积操作示意图Fig.5Schematicdiagramofconvolutionoperation红、绿、蓝三个分量卷积核中的数字就是权重,根据神经网络的计算公式:output=WX+b(1)式中:output—卷积得到的特征图对应处像素值;W—分量卷积核对应的权重矩阵;—卷积运算符号;X—卷积区域的图像像素值矩阵;b—偏置(此时b=0)。卷积核里的权重单独对相应位置图像像素值做从左到右、从上到下的点乘运算,得到红、绿、蓝三个分量分别对应的特征图,最后将三个分量特征图叠加到一起,得到RGB特征分量。
华北理工大学硕士学位论文-18-图6Sigmoid激活函数图像Fig.6SigmoidactivationfunctionimageSigmoid也有自身的缺陷,首先是饱和性,即当x时,x的导数趋于0,在网络反向传播过程中,Sigmoid的梯度包括x的导数,而两侧的导数等于0,会导致反向传播的梯度非常小,网络参数得不到更新,会造成梯度消失的情况,从而无法完成深层网络的训练。其次是Sigmoid激活函数的偏移现象,由于Sigmoid函数的输出不是0均值的,因此会导致后层神经元接受的输入也是非0均值的信号,随着网络深度的不断增加,会使数据的原始分布变化很大。最后是Sigmoid函数计算复杂度高,由于网络进行正向传播和反向传播过程中都涉及到幂运算,导致时间成本大,无法满足系统实时性的要求。tanh激活函数的数学公式和导数分别是:sinhtanhcoshxxxxxeexxxee(6)2x1x(7)tanh激活函数图像如图7所示。图7tanh激活函数图像Fig.7tanhactivationfunctionimage
本文编号:3481100
【文章来源】:华北理工大学河北省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
卷积神经网络结构示意图
华北理工大学硕士学位论文-16-世界上所有的颜色都是由三原色红、绿、蓝相互变化以及相互之间的叠加来得到的,因此一张RGB格式的彩色图片也是由红、绿、蓝三个分量叠加所组成。将彩色图片输入到神经网络里,网络看不到图像里的物体,网络能看到的只是一些像素值。图5所示是分量卷积核对输入图像红、绿、蓝三个分量像素值的卷积结果。图5卷积操作示意图Fig.5Schematicdiagramofconvolutionoperation红、绿、蓝三个分量卷积核中的数字就是权重,根据神经网络的计算公式:output=WX+b(1)式中:output—卷积得到的特征图对应处像素值;W—分量卷积核对应的权重矩阵;—卷积运算符号;X—卷积区域的图像像素值矩阵;b—偏置(此时b=0)。卷积核里的权重单独对相应位置图像像素值做从左到右、从上到下的点乘运算,得到红、绿、蓝三个分量分别对应的特征图,最后将三个分量特征图叠加到一起,得到RGB特征分量。
华北理工大学硕士学位论文-18-图6Sigmoid激活函数图像Fig.6SigmoidactivationfunctionimageSigmoid也有自身的缺陷,首先是饱和性,即当x时,x的导数趋于0,在网络反向传播过程中,Sigmoid的梯度包括x的导数,而两侧的导数等于0,会导致反向传播的梯度非常小,网络参数得不到更新,会造成梯度消失的情况,从而无法完成深层网络的训练。其次是Sigmoid激活函数的偏移现象,由于Sigmoid函数的输出不是0均值的,因此会导致后层神经元接受的输入也是非0均值的信号,随着网络深度的不断增加,会使数据的原始分布变化很大。最后是Sigmoid函数计算复杂度高,由于网络进行正向传播和反向传播过程中都涉及到幂运算,导致时间成本大,无法满足系统实时性的要求。tanh激活函数的数学公式和导数分别是:sinhtanhcoshxxxxxeexxxee(6)2x1x(7)tanh激活函数图像如图7所示。图7tanh激活函数图像Fig.7tanhactivationfunctionimage
本文编号:3481100
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3481100.html