基于深度学习复杂场景下停车管理视觉算法的研究与实现
发布时间:2021-10-11 11:37
随着我国社会经济的迅速发展,机动车数量增多,停车需求也迅速增加,但是目前的停车管理系统还存在很多局限性,如:智能化程度不够、效率低下、适用的停车环境不够广泛等。例如目前大量应用的车牌识别,首先它对于大角度复杂场景下的检测有困难,其次只适用于具有标准设备的停车场出入口的检测,不能应用于路边停车的检测。当下深度学习发展迅速,在多行业发挥了重要作用并取得了显著进步,在停车管理领域也有应用。目前车辆检测主要是利用的目标检测算法。在大角度情况下,车辆边界框之间重叠部分较多,框内特征不能准确代表车辆特征。目前常用的目标检测算法主要提取框内特征,不适合大角度情况下的车辆识别。为了解决该问题,本文设计了新的目标检测算法,以下是本文的主要内容:1.本文详细分析了几种经典的目标检测算法的基本思想及算法特点,回顾了目标检测算法的发展历程。介绍了几种常用的基于深度学习的目标检测算法,包括Anchor-based类的R-CNN系列、YOLO系列以及Anchor-free类的Corner Net、Center Net等,并且分析了每种算法的优缺点。2.针对大角度复杂情况下的车辆检测问题,分析了现有目标检测算法的不...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
高点视频中大角度、复杂场景下的停车图像
第二章相关技术理论基础9共计7层。其中卷积层用于提取图像特征,池化层是对特征图进行特征压缩,保证图像有用信息不丢失的情况下降低特征图的尺寸,减少计算量,全连接层用于最后的分类或回归,通过softmax函数得到该输入图像属于0~9中每个数字的概率即为最终的网络输出,其中最大输出概率值对应的数字就被认为是该手写数字图像对应的真实数字。图2-1LeNet卷积神经网络在LeNet之后又陆续出现了一系列神经网络框架,包括AlexNet[20]、VGG、GoogleNet[21]、ResNet等等。其中2012年提出的AlexNet神经网络是当年ImageNet比赛分类任务的冠军,该网络的创新点之一是运用ReLU函数作为CNN的激活函数,如公式(2-1)所示。ReLU={≥00<0=max(,0)(2-1)ReLU函数的引用成功解决了此前常用的激活函数Sigmoid在网络较深时存在的梯度弥散问题,在此后的神经网络中大部分均使用ReLU作为激活函数。Sigmoid函数又叫Logistic函数,如公式(2-2)所示,将输出映射到(0,1)之间。梯度弥散是因为当输入趋于无穷时,Sigmoid函数的梯度会趋于0。而且Sigmoid函数输出恒大于零,导致权重更新只能朝一个方向更新,影响收敛速度,导致训练速度慢。()=11+(2-2)以上是AlexNet在激活函数上的改进,其次该网络中还使用了Dropout方法,即随机忽略一部分神经元,避免了模型的过拟合问题。VGG神经网络突出的特点是抛弃了大的卷积核,只使用较小的卷积核,并且验证了神经网络越深效果越好。GoogleNet网络种提出了Inception模型,在同一层并行使用不同的卷积核对输入
电子科技大学硕士学位论文12图2-2SelectiveSearch获取候选区域示意图提取候选区域特征不再使用人为设定的特征,而是改用神经网络自动提龋该算法首先利用SelectiveSearch算法将图像中可能存在目标的区域截取出来并归一化到相同尺寸,其次将这些子区域输入到CNN网络中,得到候选区域特征,最后将特征输入到SVM分类器,得到最后的分类结果。R-CNN极大的提升了目标检测算法的准确率,但是其训练和测试的速度特别慢。由于速度问题,该团队在R-CNN基础上又相继提出了FastR-CNN[2]和FasterR-CNN[3],这一系列算法均属于Two-stage类目标检测算法,其基本思想都是先从图像中获取可能存在目标的候选区域,再在候选区域的基础上提取特征并分类回归,得到目标的类别及其边界框信息,实现目标检测任务。下面将简单介绍FasterR-CNN算法的基本原理。如图2-3所示,FasterR-CNN算法主要包括四个步骤。图2-3FasterRCNN网络结构示意图
【参考文献】:
期刊论文
[1]国内停车场管理系统的现状与发展趋势[J]. 刘文利. 中国新技术新产品. 2011(01)
[2]城市停车诱导信息系统理论动态研究[J]. 周智勇,陈峻,王炜. 交通运输工程与信息学报. 2006(01)
[3]先进的城市停车诱导系统的研究[J]. 王泽河,樊月珍,毛恩荣. 计算机工程与设计. 2006(02)
本文编号:3430431
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
高点视频中大角度、复杂场景下的停车图像
第二章相关技术理论基础9共计7层。其中卷积层用于提取图像特征,池化层是对特征图进行特征压缩,保证图像有用信息不丢失的情况下降低特征图的尺寸,减少计算量,全连接层用于最后的分类或回归,通过softmax函数得到该输入图像属于0~9中每个数字的概率即为最终的网络输出,其中最大输出概率值对应的数字就被认为是该手写数字图像对应的真实数字。图2-1LeNet卷积神经网络在LeNet之后又陆续出现了一系列神经网络框架,包括AlexNet[20]、VGG、GoogleNet[21]、ResNet等等。其中2012年提出的AlexNet神经网络是当年ImageNet比赛分类任务的冠军,该网络的创新点之一是运用ReLU函数作为CNN的激活函数,如公式(2-1)所示。ReLU={≥00<0=max(,0)(2-1)ReLU函数的引用成功解决了此前常用的激活函数Sigmoid在网络较深时存在的梯度弥散问题,在此后的神经网络中大部分均使用ReLU作为激活函数。Sigmoid函数又叫Logistic函数,如公式(2-2)所示,将输出映射到(0,1)之间。梯度弥散是因为当输入趋于无穷时,Sigmoid函数的梯度会趋于0。而且Sigmoid函数输出恒大于零,导致权重更新只能朝一个方向更新,影响收敛速度,导致训练速度慢。()=11+(2-2)以上是AlexNet在激活函数上的改进,其次该网络中还使用了Dropout方法,即随机忽略一部分神经元,避免了模型的过拟合问题。VGG神经网络突出的特点是抛弃了大的卷积核,只使用较小的卷积核,并且验证了神经网络越深效果越好。GoogleNet网络种提出了Inception模型,在同一层并行使用不同的卷积核对输入
电子科技大学硕士学位论文12图2-2SelectiveSearch获取候选区域示意图提取候选区域特征不再使用人为设定的特征,而是改用神经网络自动提龋该算法首先利用SelectiveSearch算法将图像中可能存在目标的区域截取出来并归一化到相同尺寸,其次将这些子区域输入到CNN网络中,得到候选区域特征,最后将特征输入到SVM分类器,得到最后的分类结果。R-CNN极大的提升了目标检测算法的准确率,但是其训练和测试的速度特别慢。由于速度问题,该团队在R-CNN基础上又相继提出了FastR-CNN[2]和FasterR-CNN[3],这一系列算法均属于Two-stage类目标检测算法,其基本思想都是先从图像中获取可能存在目标的候选区域,再在候选区域的基础上提取特征并分类回归,得到目标的类别及其边界框信息,实现目标检测任务。下面将简单介绍FasterR-CNN算法的基本原理。如图2-3所示,FasterR-CNN算法主要包括四个步骤。图2-3FasterRCNN网络结构示意图
【参考文献】:
期刊论文
[1]国内停车场管理系统的现状与发展趋势[J]. 刘文利. 中国新技术新产品. 2011(01)
[2]城市停车诱导信息系统理论动态研究[J]. 周智勇,陈峻,王炜. 交通运输工程与信息学报. 2006(01)
[3]先进的城市停车诱导系统的研究[J]. 王泽河,樊月珍,毛恩荣. 计算机工程与设计. 2006(02)
本文编号:3430431
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3430431.html