基于无人机平台的车辆检测与跟踪技术研究
发布时间:2021-01-21 16:34
利用无人机可以实现大范围的交通数据采集,且机动灵活,可以及时应对突发交通事故和拥堵路段,方便交通管理部门进行监测和管控,具有广阔的应用前景和巨大的经济价值,因此,本文对无人机平台下的车辆检测和跟踪算法进行了研究。研究内容包括以下几个方面:(1)无人机平台下的车辆检测算法研究。基于FaceBoxes网络模型分析改进,设计了一种无人机平台下的实时车辆检测方法。首先,基于多特征融合思想对网络结构进行重新设计,使得车辆预测可以包含更多的语义信息和特征细节信息。然后,基于车辆进行多尺度锚点设计,提高对不同车辆尺度和小目标车辆的适应性。最后,基于二值权重网络对算法进行时间优化。通过在航拍车辆数据集上进行实验,说明本文算法在无人机平台下具有较好的车辆检测精确度和实时性。(2)无人机平台下的车辆跟踪算法研究。在车辆检测的基础上,针对核相关滤波算法分析研究,设计了一种基于核相关滤波的车辆跟踪算法。首先,基于KCF算法建立车辆的状态估计模型,提出了状态估计可靠性判断方法,在核相关滤波状态估计不可靠时,利用车辆运动信息进行状态估计。其次,对车辆状态估计结果和改进的FaceBoxes网络的车辆检测结果进行数据...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
基于无人机的交通信息采集系统示意图
东南大学硕士学位论文82.2FaceBoxes神经网络模型分析FaceBoxes是作者借鉴了FasterRCNN的区域候选网络(RegionProposalNetwork,RPN)结构以及SSD中基于特征金字塔的多尺度检测思想,设计出的一个轻量型的CNN网络如图2-1,在人脸检测的速度和精度上有一个较好的平衡。考虑到目前计算量普遍巨大的检测网络,在无人机平台下检测效率低下,FaceBoxes对于在无人机平台下利用深度学习算法实时检测车辆提供了可行性。图2-1FaceBoxes网络结构2.2.1网络结构介绍FaceBoxes模型主要有两方面的贡献,设计了快速消除卷积层(RapidlyDigestedConvolutionalLayers,RDCL)快速减小输入空间的尺度大小,解决检测速度问题;引入多尺度卷积层(MultipleScaleConvolutionalLayers,MSCL)丰富不同网络层的离散锚点,用于多尺度检测。1.RDCL层结构如图2-1,RDCL层包含两个卷积层和两个池化层,引入一系列较大的步长,分别为4,2,2,2,使得输入图片尺度从1024迅速降到32,减小了32倍。同时,为了弥补空间尺度减小带来的信息损失,选择了相对较大的卷积核,而又不至于影响计算速度,在Conv1和Conv2层分别选用7×7,5×5的卷积核。在Conv1和Conv2层,选用C.ReLU激活函数使得输出的通道数加倍,C.ReLU是一种改进的线性修正单元(RectifiedLinearUnit,ReLU)激活函数。C.ReLU作者[28]通过统计研究发现在神经网络的底层,卷积核参数分布具有更强的负相关性,而随着网络加深,这种负相关性会逐渐衰减,然而传统的ReLU函数[29-30]具有单侧抑制特性,抹掉了所有负值,导致网络底层卷积核的冗余,于是作者定义C.ReLU函数形式如公式2.2,其中表示神经元激活函数的输入,使得C.ReLU的输出维度在ReLU函数(公式2.1)的基础上加倍。RDCL层利用C.ReLU激活通过简单反转拼接?
第二章无人机平台下的车辆检测算法研究9几乎没有下降的情况下提高了检测速度。()={,>00,≤0(2.1)()=[(),()](2.2)2.MSCL层结构为了解决不同尺度的人脸检测,作者借鉴了RPN网络结构和SSD多尺度预测方法,共提出了两部分的设计,首先设计三个串联的Inceptionv2结构[31-33]使得关联锚点的网络层可以对应不同尺度的感受野,Inceptionv2结构如图2-2所示,Inceptionv2结构拥有多个卷积分支,分别包含不同尺度的卷积核,使得拼接后的层包含不同尺寸的感受野,以此增加了网络尺度的适应性。然后作者基于不同分辨率的网络层进行多尺度设计,如图2-1中分别关联了Incepiton3,Conv3_2,Conv4_2层,这三个网络层从低到高感受野依次增大,底层网络包含更多的细节特征,更有利于预测小目标,而高层网络具有更多的语义信息,更适合预测较大目标,作者结合这三个网络层进行更有效的多尺度预测。图2-2Inceptionv2结构图2.2.2无人机平台下的问题分析本节采用大疆M100无人机,搭载DJI妙算开发板(NVDIATK1,ubuntu14.04),在此平台环境下,对FaceBoxes进行训练测试。实验采用的数据集为本实验室采集的航拍车辆数据集,包括一个图片样本集和一个测试视频集,其中图片集共4000张图片,有3000张训练样本和1000张测试样本,测试视频集包含10段航拍车辆视频。本实验训练迭代次数为30000次,学习率为0.001,并在测试视频集上进行测试,主要通过检测精确度和检测时间效率两个方面对FaceBoxes网络进行分析:
【参考文献】:
期刊论文
[1]ReLU激活函数优化研究[J]. 蒋昂波,王维维. 传感器与微系统. 2018(02)
[2]基于卡尔曼滤波的城市快速路交通密度估计与拥堵识别[J]. 张驰远,陈阳舟,郭宇奇. 交通信息与安全. 2017(05)
[3]无人机广域视频的机动车交通参数计算及分析[J]. 周雨阳,龚艺,姚琳,李小勇. 交通运输系统工程与信息. 2015(06)
[4]基于后验HOG特征的多姿态行人检测[J]. 刘威,段成伟,遇冰,柴丽颖,袁淮,赵宏. 电子学报. 2015(02)
[5]无人机视频运动目标实时检测及跟踪[J]. 董晶,傅丹,杨夏. 应用光学. 2013(02)
[6]无人飞机在交通信息采集中的研究进展和展望[J]. 彭仲仁,刘晓锋,张立业,孙健. 交通运输工程学报. 2012(06)
[7]基于ViBe的车流量统计算法[J]. 蒋建国,王涛,齐美彬,安红新. 电子测量与仪器学报. 2012(06)
[8]卡尔曼一致滤波算法综述[J]. 杨文,侍洪波,汪小帆. 控制与决策. 2011(04)
[9]基础交通信息采集技术的研究[J]. 苏洁. 制造业自动化. 2011(02)
[10]交通流预测方法综述[J]. 刘静,关伟. 公路交通科技. 2004(03)
硕士论文
[1]低空对地运动车辆检测与运动特性分析[D]. 吴长侠.中国科学技术大学 2011
本文编号:2991515
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
基于无人机的交通信息采集系统示意图
东南大学硕士学位论文82.2FaceBoxes神经网络模型分析FaceBoxes是作者借鉴了FasterRCNN的区域候选网络(RegionProposalNetwork,RPN)结构以及SSD中基于特征金字塔的多尺度检测思想,设计出的一个轻量型的CNN网络如图2-1,在人脸检测的速度和精度上有一个较好的平衡。考虑到目前计算量普遍巨大的检测网络,在无人机平台下检测效率低下,FaceBoxes对于在无人机平台下利用深度学习算法实时检测车辆提供了可行性。图2-1FaceBoxes网络结构2.2.1网络结构介绍FaceBoxes模型主要有两方面的贡献,设计了快速消除卷积层(RapidlyDigestedConvolutionalLayers,RDCL)快速减小输入空间的尺度大小,解决检测速度问题;引入多尺度卷积层(MultipleScaleConvolutionalLayers,MSCL)丰富不同网络层的离散锚点,用于多尺度检测。1.RDCL层结构如图2-1,RDCL层包含两个卷积层和两个池化层,引入一系列较大的步长,分别为4,2,2,2,使得输入图片尺度从1024迅速降到32,减小了32倍。同时,为了弥补空间尺度减小带来的信息损失,选择了相对较大的卷积核,而又不至于影响计算速度,在Conv1和Conv2层分别选用7×7,5×5的卷积核。在Conv1和Conv2层,选用C.ReLU激活函数使得输出的通道数加倍,C.ReLU是一种改进的线性修正单元(RectifiedLinearUnit,ReLU)激活函数。C.ReLU作者[28]通过统计研究发现在神经网络的底层,卷积核参数分布具有更强的负相关性,而随着网络加深,这种负相关性会逐渐衰减,然而传统的ReLU函数[29-30]具有单侧抑制特性,抹掉了所有负值,导致网络底层卷积核的冗余,于是作者定义C.ReLU函数形式如公式2.2,其中表示神经元激活函数的输入,使得C.ReLU的输出维度在ReLU函数(公式2.1)的基础上加倍。RDCL层利用C.ReLU激活通过简单反转拼接?
第二章无人机平台下的车辆检测算法研究9几乎没有下降的情况下提高了检测速度。()={,>00,≤0(2.1)()=[(),()](2.2)2.MSCL层结构为了解决不同尺度的人脸检测,作者借鉴了RPN网络结构和SSD多尺度预测方法,共提出了两部分的设计,首先设计三个串联的Inceptionv2结构[31-33]使得关联锚点的网络层可以对应不同尺度的感受野,Inceptionv2结构如图2-2所示,Inceptionv2结构拥有多个卷积分支,分别包含不同尺度的卷积核,使得拼接后的层包含不同尺寸的感受野,以此增加了网络尺度的适应性。然后作者基于不同分辨率的网络层进行多尺度设计,如图2-1中分别关联了Incepiton3,Conv3_2,Conv4_2层,这三个网络层从低到高感受野依次增大,底层网络包含更多的细节特征,更有利于预测小目标,而高层网络具有更多的语义信息,更适合预测较大目标,作者结合这三个网络层进行更有效的多尺度预测。图2-2Inceptionv2结构图2.2.2无人机平台下的问题分析本节采用大疆M100无人机,搭载DJI妙算开发板(NVDIATK1,ubuntu14.04),在此平台环境下,对FaceBoxes进行训练测试。实验采用的数据集为本实验室采集的航拍车辆数据集,包括一个图片样本集和一个测试视频集,其中图片集共4000张图片,有3000张训练样本和1000张测试样本,测试视频集包含10段航拍车辆视频。本实验训练迭代次数为30000次,学习率为0.001,并在测试视频集上进行测试,主要通过检测精确度和检测时间效率两个方面对FaceBoxes网络进行分析:
【参考文献】:
期刊论文
[1]ReLU激活函数优化研究[J]. 蒋昂波,王维维. 传感器与微系统. 2018(02)
[2]基于卡尔曼滤波的城市快速路交通密度估计与拥堵识别[J]. 张驰远,陈阳舟,郭宇奇. 交通信息与安全. 2017(05)
[3]无人机广域视频的机动车交通参数计算及分析[J]. 周雨阳,龚艺,姚琳,李小勇. 交通运输系统工程与信息. 2015(06)
[4]基于后验HOG特征的多姿态行人检测[J]. 刘威,段成伟,遇冰,柴丽颖,袁淮,赵宏. 电子学报. 2015(02)
[5]无人机视频运动目标实时检测及跟踪[J]. 董晶,傅丹,杨夏. 应用光学. 2013(02)
[6]无人飞机在交通信息采集中的研究进展和展望[J]. 彭仲仁,刘晓锋,张立业,孙健. 交通运输工程学报. 2012(06)
[7]基于ViBe的车流量统计算法[J]. 蒋建国,王涛,齐美彬,安红新. 电子测量与仪器学报. 2012(06)
[8]卡尔曼一致滤波算法综述[J]. 杨文,侍洪波,汪小帆. 控制与决策. 2011(04)
[9]基础交通信息采集技术的研究[J]. 苏洁. 制造业自动化. 2011(02)
[10]交通流预测方法综述[J]. 刘静,关伟. 公路交通科技. 2004(03)
硕士论文
[1]低空对地运动车辆检测与运动特性分析[D]. 吴长侠.中国科学技术大学 2011
本文编号:2991515
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2991515.html