基于ZYNQ的车载目标检测系统设计与实现
发布时间:2021-06-17 13:40
车载目标检测系统作为自动驾驶中的重要组成部分,可有效降低交通事故的发生。以卷积神经网络为代表的目标检测算法相较浅层机器学习算法在检测精度方面有了明显提升,但也为低功耗、小型化的嵌入式实现带来了困难。文中使用多核异架构ZYNQ-SOC平台,采用软硬件协同设计的原则,设计了一款车载目标检测系统。针对卷积神经网络结构复杂的问题,提出了一种软硬件划分的改进方法;针对运算量巨大的问题,提出了使用FPGA算法实现卷积运算的并行加速。试验结果表明,该系统设计在各种复杂路况和光照条件下检测结果准确,在功能上体现了良好的鲁棒性。在加速性能方面,相对于ARM cortex-A9吞吐量提高了百倍级,运算效能也达到了60倍左右。在检测精度方面,使用YOLOv2算法在不同检测场景下准确率和覆盖率均超过80%。系统的各项指标达均到了项目设计要求,满足了车载目标检测的应用需求。
【文章来源】:机械设计. 2020,37(S1)北大核心CSCD
【文章页数】:4 页
【部分图文】:
目标检测系统框图
通过统计YOLO模型的计算流程,卷积运算的计算量占比大于90%,而参数数量占比大于90%的全链接层同样被卷积和池化操作代替,因此硬件加速的目标主要针对基于乘加运算的卷积过程。卷积操作由乘加运算构成,非常适合使用FPGA对其进行并行化操作,最大池化通过逻辑比较也能很好的实现。通过预先定义内存偏移地址来执行YOLO模型中各种数据的交叉计算。目标检测算法的由串行到硬件加速的并行化转换如图2所示。2.2 FPGA加速设计
FPFA硬件加速设计如图3所示。加速器延迟主要由3部分构成:访问存储器的延迟、芯片上传输的延迟及计算的延迟。根据加速器的体系结构,它必须分为4个部分:输入输出、权重加载、算法运算和结果返回部分。
本文编号:3235301
【文章来源】:机械设计. 2020,37(S1)北大核心CSCD
【文章页数】:4 页
【部分图文】:
目标检测系统框图
通过统计YOLO模型的计算流程,卷积运算的计算量占比大于90%,而参数数量占比大于90%的全链接层同样被卷积和池化操作代替,因此硬件加速的目标主要针对基于乘加运算的卷积过程。卷积操作由乘加运算构成,非常适合使用FPGA对其进行并行化操作,最大池化通过逻辑比较也能很好的实现。通过预先定义内存偏移地址来执行YOLO模型中各种数据的交叉计算。目标检测算法的由串行到硬件加速的并行化转换如图2所示。2.2 FPGA加速设计
FPFA硬件加速设计如图3所示。加速器延迟主要由3部分构成:访问存储器的延迟、芯片上传输的延迟及计算的延迟。根据加速器的体系结构,它必须分为4个部分:输入输出、权重加载、算法运算和结果返回部分。
本文编号:3235301
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3235301.html
最近更新
教材专著