基于嵌入式的行人检测跟踪研究与实现

发布时间:2021-03-08 01:59
  计算机视觉(Computer Vision)是专门对计算机图形学进行研究的重要领域。而行人检测是目前计算机视觉研究的热点。在社会公共安全、商业活动分析、军事国防安全和智慧交通出行等领域拥有巨大的经济价值和潜力。本文在行人检测方面,以YOLO-v3算法为基础,对该算法的检测原理和网络训练过程进行详细研究,并提出基于自适应空间特征金字塔融合的模型优化方法,加入一种可提升感受野的RFB模块,有效融合深层次特征,提升行人检测模型识别率。然后整合公开数据集voc、coco、sysu和prw的行人图片,构建行人数据集,并使用pytorch框架完成数据训练,最终模型测试集mAP达到78.96,通过网络选取行人图片测试效果良好,证明模型泛化能力优良。在行人多目标跟踪方面,采用的多目标跟踪的Deep sort算法,分析Deep sort的具体算法原理,并提出一些优化的策略,最后基于前面得到的YOLO-v3优化模型,把检测和跟踪两者结合,完成一体化设计,并在MOT16数据集和实际行车记录仪上测试,性能良好,达到精度高、实时性满足需求的目的。根据本文提出的基于YOLOv3行人检测跟踪优化算法,做出了基于嵌入... 

【文章来源】:中北大学山西省

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

基于嵌入式的行人检测跟踪研究与实现


背景建模算法Fig1-3Backgroundmodelingalgorithm

特征提取


中北大学学位论文6(2)可变形部件分离的模型匹配优化;(3)分类器采用SVM的变体,识别能力更强的latent-SVM,简化训练流程并提高效率。前面两种方法,传统计算机视觉的背景建模和统计机器学习算法,在行人检测领域奠定了研究基础,但仍然局限性较强,在实际场景中条件复杂,并不适用。因此随着大数据和5G的发展,硬件的计算能力也大幅度提高,日积月累的数据量开始作为深度学习技术发展的营养土,滋润其茁壮成长,在大规模的数据训练中取得卓越的表现性能。对于计算机视觉方向的常见分类检测分割任务,深度学习可以很简单的提取高层次的图像特征,在公开的挑战赛和数据集中取得超越人类的成绩,出现了大量的落地应用,其中人脸检测,手机支付应用范围最广。因此研究者也将其应用于行人车辆等检测任务中,也取得一定的进步。比较传统算法,深度学习在特征提取方面具有明显的优势,具体提取特征过程如所示:基于深度卷积神经网络[37]的目标检测算法由最简单的CNN逐步发展为R-CNN、Faster-RCNN、SSD、FPN、YOLO[38]等更深层的网络,这些算法均被应用到行人检测中,并且和之前的两种方法有着明显的提升,在下一章将具体阐述算法原理。图1-5CNN特征提取Fig1-5CNNfeatureextraction1.2.2目标跟踪国内外现状目标跟踪,准确的说视觉目标跟踪(VisualObjectTracking),是计算机视觉领域的一个重要问题。尽管近年来受到了广泛研究,目标跟踪问题由于本身的高难度、高质量数据的稀少,研究热度比目标检测、语义分割等基本视觉任务略低一些。深度学习的发展和计算机算力的增强带来视觉算法性能的突飞猛进,而目标跟踪领域中基于深度神经网络的方法只在近几年才初见端倪,可谓上升空间巨大。但在实际应用,其中需要考虑

原理图,算法,原理,超平面


中北大学学位论文13形的比例加权结果在圆形中求和,最终得到正确的输出结果。初始得到alpha,需要对向量矩阵D迭代更新,目的是使识别正确的样本参数值降低而识别错误的样本参数升高。假如数据识别正确,可将数据的参数更改为:()=()()(式2-2)如果某些数据被识别错误,那么该数据的参数需变为:()=()()(式2-3)计算得到D,AdaBoost算法会进行新一轮更新迭代。这种反复迭代更新的过程直到训练准确率接近100或者弱分类器的指标满足用户的需求为止。②支持向量机(supportvectormachines,SVM)是一种二分类模型,它是一种通过在特征空间上的数据间隔的线性分类器,数据间隔的距离间隔使他不同于其他分类器,其中还包含核方法,通过该方法被称为真正意义上的非线性分类器图2-4SVM算法原理Fig2-4SVMalgorithmSVM的的优化计策就是距离最大化,形象的比喻可为一个凸二次规划的求解问题,也相当于求解损失函数的最值问题(最小值)。SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。如图2-4所示,wx+b=0即为分离超平面,对于常见的线性可分的数据集,符合要求的超平面有无穷多个(称为感知机),但是几何距离最大的分离超平面却是独一无二的。在深度学习盛行之前,SVM是学术界使用最多的算法,有着自己的优缺点,即便是很火的神经网络,也会存在一些问题:需输入的参数过多,输出结果难以解释,不能观


本文编号:3070212

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3070212.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cc8ff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com