无人机系统下基于学习的道路车辆检测跟踪技术
发布时间:2021-01-16 15:31
无人机因其体积小、重量轻、易隐蔽、灵活控制等优点开始在民用领域得到广泛应用。目前,传统目标检测与跟踪技术无法满足无人机平台下复杂动态的视频目标检测与跟踪任务需求。本文以道路车辆为被测对象,利用深度学习技术,对无人机系统下的道路车辆检测与跟踪方法进行深入研究,论文的主要工作反映如下:(1)基于YOLO(You Only Look Once)网络的车辆检测改进方法研究。结合不同连接方式的特征提取网络,重构了一种基于YOLO的网络模型,用于实时检测无人机航拍图像下小目标的道路车辆。首先,为保留小目标在水平方向上的细粒度特征,通过调整网格数量设置来增加特征图横向分辨率。其次,利用K-means聚类方法确定网络中Anchor boxes的大小和数量,用于匹配所需检测车辆目标的尺寸,以便减少计算复杂度,提高网络预测能力。然后,针对随机初始化网络训练慢、难收敛的问题,选取ResNet-v1-50预训练模型来替换原模型的浅层结构。在网络深层结构中,采用不同连接方式的密集拓扑结构,强化网络的小目标特征提取能力。此外,为提高网络池化效率,采用可学习的权重参数来平衡最大值池化和平均池化的使用比例。不同天气、...
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
一阶检测方法结构图
图 1. 2 二阶检测方法结构图目标检测方法中具有代表性的是 R-CNN 系列检测方法。Ross Girshick 等人相]和 Fast R-CNN[12]方法,这两种方法都是通过选择性搜索方式(Selective Search标检测的感兴趣区域。在 SS 中,通过从每个单独的像素开始作为一个组,然纹理并合并两个最相近的组。但为了避免单个区域吞噬其他区域,SS 更倾向于进行合并,然后继续合并区域直到所有内容组合在一起。R-CNN 利用 SS 方法0 个感兴趣区域框,然后将这些区域归一化到固定大小的图像并单独馈送到神于 R-CNN 方法,Fast R-CNN 则采用在整张图上用特征提取器来提取特征,然将感兴趣区域应用在特征图上,这样的做法就不需要做重复的特征提取。此外oling 方式来将这些区域归一化到固定大小的图像。后来,Ross Girshick 等人[13]R-CNN 方法。除了使用内嵌的区域建议网络(Region Proposal Network,RPN),用了与 Fast R-CNN 相同的设计。RPN 网络相对 SS 方法更高效,在每张图上仅需要 10ms 的时间。此外,何凯明等人[14]提出的 Mask R-CNN 方法不仅可以,也可以用于图像目标检测。针对于目标检测,这个方法的亮点在于对 ROI 进。他提出了新的 ROI Align 操作,即加入了双线性插值的方法来精炼感兴趣
(2)目标表观信息变化由于光照强度,拍摄角度等客观因素存在使得目标的表观信息发生变化,容易造成跟踪器发生误判情况。(3)目标部分遮挡或全遮挡针对视频序列中的运动目标,容易发生目标部分遮挡或全遮挡情况。对于部分遮挡情况,目标信息量的减少容易使得目标跟踪丢失。对于全遮挡情况,短暂的目标消失需要跟踪器具有一定的预测能力。如果期间目标的实际运动状态发生变化,极容易产生大偏差的预测结果。对于多目标跟踪方法,其根据跟踪轨迹的生成顺序主要分为在线多目标跟踪算法和离线多目标跟踪算法。在离线多目标跟踪算法[23-25]中,一般在目标检测关系中构建相应的图模型,对于设计检测框之间的匹配性或距离度量是决定图模型构建正确与否的关键。而对于在线多目标跟踪算法[26-28]则是根据当前检测的结果,计算出当前检测框与已有轨迹的匹配度,以确定匹配的正确性。因此,无论是在线多目标跟踪还是离线多目标跟踪,如何学习基于检测结果的特征计算匹配的相似度或距离度量都是多目标跟踪方法的重要步骤。本文主要研究深度学习方法在目标跟踪领域的应用技术。
【参考文献】:
期刊论文
[1]基于并行跟踪检测框架与深度学习的目标跟踪算法[J]. 闫若怡,熊丹,于清华,肖军浩,卢惠民. 计算机应用. 2019(02)
本文编号:2981074
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
一阶检测方法结构图
图 1. 2 二阶检测方法结构图目标检测方法中具有代表性的是 R-CNN 系列检测方法。Ross Girshick 等人相]和 Fast R-CNN[12]方法,这两种方法都是通过选择性搜索方式(Selective Search标检测的感兴趣区域。在 SS 中,通过从每个单独的像素开始作为一个组,然纹理并合并两个最相近的组。但为了避免单个区域吞噬其他区域,SS 更倾向于进行合并,然后继续合并区域直到所有内容组合在一起。R-CNN 利用 SS 方法0 个感兴趣区域框,然后将这些区域归一化到固定大小的图像并单独馈送到神于 R-CNN 方法,Fast R-CNN 则采用在整张图上用特征提取器来提取特征,然将感兴趣区域应用在特征图上,这样的做法就不需要做重复的特征提取。此外oling 方式来将这些区域归一化到固定大小的图像。后来,Ross Girshick 等人[13]R-CNN 方法。除了使用内嵌的区域建议网络(Region Proposal Network,RPN),用了与 Fast R-CNN 相同的设计。RPN 网络相对 SS 方法更高效,在每张图上仅需要 10ms 的时间。此外,何凯明等人[14]提出的 Mask R-CNN 方法不仅可以,也可以用于图像目标检测。针对于目标检测,这个方法的亮点在于对 ROI 进。他提出了新的 ROI Align 操作,即加入了双线性插值的方法来精炼感兴趣
(2)目标表观信息变化由于光照强度,拍摄角度等客观因素存在使得目标的表观信息发生变化,容易造成跟踪器发生误判情况。(3)目标部分遮挡或全遮挡针对视频序列中的运动目标,容易发生目标部分遮挡或全遮挡情况。对于部分遮挡情况,目标信息量的减少容易使得目标跟踪丢失。对于全遮挡情况,短暂的目标消失需要跟踪器具有一定的预测能力。如果期间目标的实际运动状态发生变化,极容易产生大偏差的预测结果。对于多目标跟踪方法,其根据跟踪轨迹的生成顺序主要分为在线多目标跟踪算法和离线多目标跟踪算法。在离线多目标跟踪算法[23-25]中,一般在目标检测关系中构建相应的图模型,对于设计检测框之间的匹配性或距离度量是决定图模型构建正确与否的关键。而对于在线多目标跟踪算法[26-28]则是根据当前检测的结果,计算出当前检测框与已有轨迹的匹配度,以确定匹配的正确性。因此,无论是在线多目标跟踪还是离线多目标跟踪,如何学习基于检测结果的特征计算匹配的相似度或距离度量都是多目标跟踪方法的重要步骤。本文主要研究深度学习方法在目标跟踪领域的应用技术。
【参考文献】:
期刊论文
[1]基于并行跟踪检测框架与深度学习的目标跟踪算法[J]. 闫若怡,熊丹,于清华,肖军浩,卢惠民. 计算机应用. 2019(02)
本文编号:2981074
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2981074.html