基于轻量级神经网络的交通场景的目标检测方法研究
发布时间:2021-03-17 20:23
基于机器视觉的目标检测是自动驾驶领域中炙手可热的研究方向之一,近些年不断涌现出许多优秀的基于深度学习的目标检测算法,其中YOLOv3目标检测算法是一个在检测精度和速度方面上表现优异的端到端网络。YOLOv3算法可以对任何分辨率的图片进行目标检测,但是在网络训练过程和预测阶段的边界框位置回归计算都存在精度偏差,还存在网络模型占用巨大的运行内存和存储空间的问题。为此在复杂的交通场景下设计轻量级的YOLOv3网络来准确地进行车辆目标检测是符合实际工程需求。以下是本文对原始的YOLOv3网络进行了研究和改进的具体方法:(1)针对YOLOv3网络在交通场景下长方形视野的图像进行伸缩拉伸以后,图像的变形会降低检测的准确率,本文通过K-Means算法聚类得到锚框尺寸,通过计算公式设置预测特征图上每层映射的预选框尺寸大小,有效地改进网络在检测长方形视野交通场景的精度问题,减少模型在候选框参数训练的过程中的冗余运算的时间消耗。(2)针对交通场景的图像生成的预选框类别标签数量不均衡,容易造成误检和漏检的问题,采用的方法是通过焦点损失函数解决样本标签失衡问题,在Pascal VOC数据集上证实了其有效地提升...
【文章来源】:杭州电子科技大学浙江省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
自动驾驶车辆展示物流运输过程中的自动驾驶应用已经带来了许多益处和经济效益,比如传统的人力运输
浙江省硕士学位论文13征,具有很强的先验性,使得特征训练能够在特征提取环节里有更多的选择性。2.2.3激活函数激活函数(activatefunction)又称作为非线性映射(non-linearitymapping),对机器去理解数据样本的非线性化特点具有非常重要的意义。它摆脱了网络模型线性操作层的叠加只会形成线性映射的特点,使得网络模型具有更广泛性和普适性。在实际应用中,激活函数的种类为适应不同环境下有各种各样的,介绍几种典型的激活函数概念及其特点,具体有ReLU、Sigmoid和Tanh,它们各自有着自己的优缺点,需要在不同网络模型当中针对不同情况使用不同的激活函数方能使模型达到最优的组合[19]。ReLU函数表达式为:f(x)max{0,x}(2.6)式(2.6)中x代表像素点元素的输入值。图2.4ReLU函数曲线图优点:相比较于其他激活函数不存在饱和区,故不存在梯度消失问题,能够保持特征提取不衰减,从而减缓模型在训练过程中弥补梯度消失的问题。缺点:因为当x<0时,ReLU函数处在硬饱和区,随着训练的迭代导致权重无法更新,即训练的神经单元无效。Sigmoid函数表达式:1()1exp()fxx(2.7)式(2.7)中中x代表像素点元素的输入值。
浙江省硕士学位论文14图2.5Sigmoid函数曲线图优点:可以接受任意大小的输入,并输出在一个固定的区间(0,1)之间,经常被用在二分类的输入层中。缺点:函数中有很大的梯度几乎为0的饱和区域,会导致神经网络反向传播时链式求导的梯度值非常小,梯度弥散甚至梯度消失的问题随之出现。再者函数不关于原点中心对称,会使得一些反向传播过程中网络模型的所有参数的更新分向都是一样的,增加了神经网络训练的难度。Tanh函数表达式:ee()eexxxxfx(2.8)式(2.8)中中x代表像素点元素的输入值。图2.6Tanh函数曲线图优点:解决了Sigmoid函数不关于原点中心对称的问题,且Tanh函数的斜率相比于Sigmoid函数更陡,故收敛速度快缺点:依旧存在饱和区,容易造成梯度弥散的问题现象。ReLU激活函数当输入为负值时,学习率可能会变得缓慢,直至神经单元无效死亡,从而剩下的训练过程当中一直保持沉默。而Sigmoid的激活函数在分类任务当中能够实现二分类,
【参考文献】:
期刊论文
[1]基于卷积神经网络的中国北方冬小麦遥感估产[J]. 周亮,慕号伟,马海姣,陈高星. 农业工程学报. 2019(15)
[2]Multi-scale object detection by top-down and bottom-up feature pyramid network[J]. ZHAO Baojun,ZHAO Boya,TANG Linbo,WANG Wenzheng,WU Chen. Journal of Systems Engineering and Electronics. 2019(01)
[3]智能交通沙盘中的关键技术研究[J]. 刘浩,李思其. 电脑知识与技术. 2018(34)
[4]基于深度学习的短视频中的物体检测与内容推荐系统研究[J]. 石殷巧,刘守印,马超. 计算机与现代化. 2018(11)
[5]基于深度卷积网络的目标检测综述[J]. 吴帅,徐勇,赵东宁. 模式识别与人工智能. 2018(04)
[6]卷积网络深度学习算法与实例[J]. 陈旭,张军,陈文伟,李硕豪. 广东工业大学学报. 2017(06)
[7]基于加速区域卷积神经网下的人物身份属性识别方法[J]. 周林林,胡晓君,张鲁殷,贾伟光,杨阳,丁祥,张雪飞,杨东东. 电子元器件与信息技术. 2017(04)
[8]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[9]复杂环境下的车辆目标检测方法研究[J]. 赵伟,李欣,王鹏. 森林工程. 2014(03)
[10]无人驾驶汽车的发展现状及方向[J]. 乔维高,徐学进. 上海汽车. 2007(07)
硕士论文
[1]基于深度学习的复杂环境下多目标检测方法研究[D]. 朱玉刚.杭州电子科技大学 2019
[2]Android移动平台下基于深度学习的目标检测技术研究[D]. 顾帅.西安电子科技大学 2018
[3]基于TensorFlow的Android平台实时车辆和交通标志牌检测的研究[D]. 张州.中国地质大学(北京) 2018
[4]基于深度学习的车牌字符识别研究[D]. 杨志.安徽大学 2018
[5]基于深度卷积特征融合的多尺度行人检测[D]. 郭爱心.中国科学技术大学 2018
[6]基于卷积神经网络的行人重识别算法研究[D]. 徐阳.华东师范大学 2018
本文编号:3087666
【文章来源】:杭州电子科技大学浙江省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
自动驾驶车辆展示物流运输过程中的自动驾驶应用已经带来了许多益处和经济效益,比如传统的人力运输
浙江省硕士学位论文13征,具有很强的先验性,使得特征训练能够在特征提取环节里有更多的选择性。2.2.3激活函数激活函数(activatefunction)又称作为非线性映射(non-linearitymapping),对机器去理解数据样本的非线性化特点具有非常重要的意义。它摆脱了网络模型线性操作层的叠加只会形成线性映射的特点,使得网络模型具有更广泛性和普适性。在实际应用中,激活函数的种类为适应不同环境下有各种各样的,介绍几种典型的激活函数概念及其特点,具体有ReLU、Sigmoid和Tanh,它们各自有着自己的优缺点,需要在不同网络模型当中针对不同情况使用不同的激活函数方能使模型达到最优的组合[19]。ReLU函数表达式为:f(x)max{0,x}(2.6)式(2.6)中x代表像素点元素的输入值。图2.4ReLU函数曲线图优点:相比较于其他激活函数不存在饱和区,故不存在梯度消失问题,能够保持特征提取不衰减,从而减缓模型在训练过程中弥补梯度消失的问题。缺点:因为当x<0时,ReLU函数处在硬饱和区,随着训练的迭代导致权重无法更新,即训练的神经单元无效。Sigmoid函数表达式:1()1exp()fxx(2.7)式(2.7)中中x代表像素点元素的输入值。
浙江省硕士学位论文14图2.5Sigmoid函数曲线图优点:可以接受任意大小的输入,并输出在一个固定的区间(0,1)之间,经常被用在二分类的输入层中。缺点:函数中有很大的梯度几乎为0的饱和区域,会导致神经网络反向传播时链式求导的梯度值非常小,梯度弥散甚至梯度消失的问题随之出现。再者函数不关于原点中心对称,会使得一些反向传播过程中网络模型的所有参数的更新分向都是一样的,增加了神经网络训练的难度。Tanh函数表达式:ee()eexxxxfx(2.8)式(2.8)中中x代表像素点元素的输入值。图2.6Tanh函数曲线图优点:解决了Sigmoid函数不关于原点中心对称的问题,且Tanh函数的斜率相比于Sigmoid函数更陡,故收敛速度快缺点:依旧存在饱和区,容易造成梯度弥散的问题现象。ReLU激活函数当输入为负值时,学习率可能会变得缓慢,直至神经单元无效死亡,从而剩下的训练过程当中一直保持沉默。而Sigmoid的激活函数在分类任务当中能够实现二分类,
【参考文献】:
期刊论文
[1]基于卷积神经网络的中国北方冬小麦遥感估产[J]. 周亮,慕号伟,马海姣,陈高星. 农业工程学报. 2019(15)
[2]Multi-scale object detection by top-down and bottom-up feature pyramid network[J]. ZHAO Baojun,ZHAO Boya,TANG Linbo,WANG Wenzheng,WU Chen. Journal of Systems Engineering and Electronics. 2019(01)
[3]智能交通沙盘中的关键技术研究[J]. 刘浩,李思其. 电脑知识与技术. 2018(34)
[4]基于深度学习的短视频中的物体检测与内容推荐系统研究[J]. 石殷巧,刘守印,马超. 计算机与现代化. 2018(11)
[5]基于深度卷积网络的目标检测综述[J]. 吴帅,徐勇,赵东宁. 模式识别与人工智能. 2018(04)
[6]卷积网络深度学习算法与实例[J]. 陈旭,张军,陈文伟,李硕豪. 广东工业大学学报. 2017(06)
[7]基于加速区域卷积神经网下的人物身份属性识别方法[J]. 周林林,胡晓君,张鲁殷,贾伟光,杨阳,丁祥,张雪飞,杨东东. 电子元器件与信息技术. 2017(04)
[8]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[9]复杂环境下的车辆目标检测方法研究[J]. 赵伟,李欣,王鹏. 森林工程. 2014(03)
[10]无人驾驶汽车的发展现状及方向[J]. 乔维高,徐学进. 上海汽车. 2007(07)
硕士论文
[1]基于深度学习的复杂环境下多目标检测方法研究[D]. 朱玉刚.杭州电子科技大学 2019
[2]Android移动平台下基于深度学习的目标检测技术研究[D]. 顾帅.西安电子科技大学 2018
[3]基于TensorFlow的Android平台实时车辆和交通标志牌检测的研究[D]. 张州.中国地质大学(北京) 2018
[4]基于深度学习的车牌字符识别研究[D]. 杨志.安徽大学 2018
[5]基于深度卷积特征融合的多尺度行人检测[D]. 郭爱心.中国科学技术大学 2018
[6]基于卷积神经网络的行人重识别算法研究[D]. 徐阳.华东师范大学 2018
本文编号:3087666
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3087666.html