基于YOLO V3的航拍车辆图像检测方法研究
发布时间:2020-12-17 11:58
随着科技的发展以及生活水平的提高,目标检测技术为人们的衣食住行提供了很大的方便,尤其是基于深度学习的目标检测算法的发展,在智能交通、国家安防、军事、医疗等领域有着重要的应用。航拍车辆检测技术是目标检测领域的热点,对交通的管理和事故的处理以及在打击违法犯罪上发挥着重要的作用。但是由于检测场景比较复杂,检测目标尺寸较小,给目标检测技术带了很大的考验。本文以航拍车辆检测为研究检测对象,采用YOLO V3算法对其进行研究,并且将其与常用的几种目标检测算法进行对比,结合检测的准确度和实时性衡量,对YOLO V3算法进行改进。具体完成的工作如下:针对小目标检测中出现的检测精度低,误检率高等问题,提出了一种改进的YOLO V3航拍车辆目标检测算法,YOLO V3算法中的特征融合的思想以及三个尺度对目标进行检测的网络,对大小目标的检测都比较突出。先是对YOLO V3的网络进行了改进,通过步长为4的下采样操作,融合更深层的特征,建立更细粒的小目标检测层,然后提出了一种anchor box合理分配的数学方法,使得K-means聚类生成的anchor box可以在三个检测尺度上合理分配。该方法在VEDAI公...
【文章来源】:江西理工大学江西省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
无人的应用实例本文对航拍车辆检测方法[2]
第二章目标检测算法相关理论7第二章目标检测算法相关理论2.1神经网络理论概述2.1.1全连接网络模型当网络层数和参数量较少时,一般会用上全连接网络,网络模型包含了输入层、隐藏层和输出层,各层的节点数及结构如图2.1所示。图2.1全连接神经网络图2.1中是一个全连接神经网络示意图,其计算过程如下:第一层:111][][][=b+xWz,)(]1[]1[zσ=a,x为整个网络的输入值向量,]1[a是输入层的运算经过激活函数得到的特征向量,]1[z是经过输入层的运算没有经过激活函数时的向量,]1[W为权重矩阵,]1[b是神经网络里面常说的偏置。第二层:2122][][][][=b+aWz,)(]2[]2[zσ=a,]1[a为网络的输入值向量,是第一层的运算经过激活函数得到的特征向量,]2[z是]2[a经过第一层的运算没有经过激活函数时的向量,]2[W为第一层权重矩阵,]2[b是第一层的偏置。虽然浅层的全连接神经网络在处理一些问题时,比如房价的预测等问题上,有很好的建模能力,但是如果是对于三维的图片来说就显得参数异常的多,导致训练难以收敛,甚至衰弱。如图2.2是一张64×64×3的三通道彩色图片,将它输入进全连接神经网络,进行图像识别任务。
第二章目标检测算法相关理论8图2.2用于图片识别的全连接网络示意图对于图2.2的三通道彩色图片来说,可以将每个像素点展开,输入到全连接神经网络中,例如输入一张64×64×3的图片,展开后是64×64×3=12288,可以把它看成是一个1×12288的特征向量,图2.2中的第一个隐层也是12288个节点,此时权重矩阵就应该是12288×12288=150994944个参数,大约是1.5亿参数,输入一个小尺寸图片,参数量就达到了1.5亿左右。综上所述,全连接网络在处理分辨率较大的三通道图片时,网络模型参数过大,不利于模型的训练。2.1.2卷积神经网络模型上一节解了全连接层的前向传播过程,以及了解到了它的一些局限性。卷积神经网络的产生,全连接神经网络的参数太大问题得到了很好的解决。比如在手写数字识别上,手写数字识别是第一个卷积神经网络,它是由YannLeCun等人在1989年提出来的,命名LeNet[37]网络。图2.3LetNet-5网络结构示意图
【参考文献】:
期刊论文
[1]光流法和显著性相结合的动态背景下运动目标检测方法[J]. 黄锋,易嘉闻,吴健辉,何伟,李武劲,欧先锋. 成都工业学院学报. 2020(01)
[2]基于深度学习的目标检测技术的研究综述[J]. 罗元,王薄宇,陈旭. 半导体光电. 2020(01)
[3]结合深度学习与支持向量机的金属零件识别[J]. 郑健红,鲍官军,张立彬,荀一,陈教料. 中国图象图形学报. 2019(12)
[4]基于背景差分法和帧间差分法的车辆运动目标检测[J]. 罗敏,刘洞波,文浩轩,陈鑫海,宋丹. 湖南工程学院学报(自然科学版). 2019(04)
[5]基于深度学习的车辆检测[J]. 时文忠,王忠荣. 中国公共安全. 2019(12)
[6]基于OverFeat模型的长江口南汇潮滩植被分类[J]. 李静,韩震,王文柳,崔艳荣. 生态科学. 2019(04)
[7]基于深度学习的零件实例分割识别研究[J]. 黄海松,魏中雨,姚立国. 组合机床与自动化加工技术. 2019(05)
[8]改进的YOLO V3算法及其在小目标检测中的应用[J]. 鞠默然,罗海波,王仲博,何淼,常铮,惠斌. 光学学报. 2019(07)
[9]特征金字塔多尺度全卷积目标检测算法[J]. 林志洁,罗壮,赵磊,鲁东明. 浙江大学学报(工学版). 2019(03)
[10]背景帧间差分法的移动目标跟踪研究[J]. 黄金海. 中国仪器仪表. 2019(01)
硕士论文
[1]航空影像下小车辆的快速定向检测算法设计[D]. 许楠.江西理工大学 2019
[2]基于随机梯度下降的神经网络权重优化算法[D]. 张晋晶.西南大学 2018
[3]基于HOG特征提取的车辆检测方法研究[D]. 刘家旭.华北电力大学 2017
本文编号:2922001
【文章来源】:江西理工大学江西省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
无人的应用实例本文对航拍车辆检测方法[2]
第二章目标检测算法相关理论7第二章目标检测算法相关理论2.1神经网络理论概述2.1.1全连接网络模型当网络层数和参数量较少时,一般会用上全连接网络,网络模型包含了输入层、隐藏层和输出层,各层的节点数及结构如图2.1所示。图2.1全连接神经网络图2.1中是一个全连接神经网络示意图,其计算过程如下:第一层:111][][][=b+xWz,)(]1[]1[zσ=a,x为整个网络的输入值向量,]1[a是输入层的运算经过激活函数得到的特征向量,]1[z是经过输入层的运算没有经过激活函数时的向量,]1[W为权重矩阵,]1[b是神经网络里面常说的偏置。第二层:2122][][][][=b+aWz,)(]2[]2[zσ=a,]1[a为网络的输入值向量,是第一层的运算经过激活函数得到的特征向量,]2[z是]2[a经过第一层的运算没有经过激活函数时的向量,]2[W为第一层权重矩阵,]2[b是第一层的偏置。虽然浅层的全连接神经网络在处理一些问题时,比如房价的预测等问题上,有很好的建模能力,但是如果是对于三维的图片来说就显得参数异常的多,导致训练难以收敛,甚至衰弱。如图2.2是一张64×64×3的三通道彩色图片,将它输入进全连接神经网络,进行图像识别任务。
第二章目标检测算法相关理论8图2.2用于图片识别的全连接网络示意图对于图2.2的三通道彩色图片来说,可以将每个像素点展开,输入到全连接神经网络中,例如输入一张64×64×3的图片,展开后是64×64×3=12288,可以把它看成是一个1×12288的特征向量,图2.2中的第一个隐层也是12288个节点,此时权重矩阵就应该是12288×12288=150994944个参数,大约是1.5亿参数,输入一个小尺寸图片,参数量就达到了1.5亿左右。综上所述,全连接网络在处理分辨率较大的三通道图片时,网络模型参数过大,不利于模型的训练。2.1.2卷积神经网络模型上一节解了全连接层的前向传播过程,以及了解到了它的一些局限性。卷积神经网络的产生,全连接神经网络的参数太大问题得到了很好的解决。比如在手写数字识别上,手写数字识别是第一个卷积神经网络,它是由YannLeCun等人在1989年提出来的,命名LeNet[37]网络。图2.3LetNet-5网络结构示意图
【参考文献】:
期刊论文
[1]光流法和显著性相结合的动态背景下运动目标检测方法[J]. 黄锋,易嘉闻,吴健辉,何伟,李武劲,欧先锋. 成都工业学院学报. 2020(01)
[2]基于深度学习的目标检测技术的研究综述[J]. 罗元,王薄宇,陈旭. 半导体光电. 2020(01)
[3]结合深度学习与支持向量机的金属零件识别[J]. 郑健红,鲍官军,张立彬,荀一,陈教料. 中国图象图形学报. 2019(12)
[4]基于背景差分法和帧间差分法的车辆运动目标检测[J]. 罗敏,刘洞波,文浩轩,陈鑫海,宋丹. 湖南工程学院学报(自然科学版). 2019(04)
[5]基于深度学习的车辆检测[J]. 时文忠,王忠荣. 中国公共安全. 2019(12)
[6]基于OverFeat模型的长江口南汇潮滩植被分类[J]. 李静,韩震,王文柳,崔艳荣. 生态科学. 2019(04)
[7]基于深度学习的零件实例分割识别研究[J]. 黄海松,魏中雨,姚立国. 组合机床与自动化加工技术. 2019(05)
[8]改进的YOLO V3算法及其在小目标检测中的应用[J]. 鞠默然,罗海波,王仲博,何淼,常铮,惠斌. 光学学报. 2019(07)
[9]特征金字塔多尺度全卷积目标检测算法[J]. 林志洁,罗壮,赵磊,鲁东明. 浙江大学学报(工学版). 2019(03)
[10]背景帧间差分法的移动目标跟踪研究[J]. 黄金海. 中国仪器仪表. 2019(01)
硕士论文
[1]航空影像下小车辆的快速定向检测算法设计[D]. 许楠.江西理工大学 2019
[2]基于随机梯度下降的神经网络权重优化算法[D]. 张晋晶.西南大学 2018
[3]基于HOG特征提取的车辆检测方法研究[D]. 刘家旭.华北电力大学 2017
本文编号:2922001
本文链接:https://www.wllwen.com/shoufeilunwen/boshibiyelunwen/2922001.html