基于改进YOLOv3-tiny的田间行人与农机障碍物检测
发布时间:2021-11-21 17:41
为实现农机自主作业中的避障需求,本文针对室外田间自然场景中因植被遮挡、背景干扰而导致障碍物难以检测的问题,基于嵌入式平台应用设备,提出了农机田间作业时行人和农机障碍物检测的改进模型,更好地平衡了模型的检测速度与检测精度。该改进模型以You only look once version 3-tiny(YOLOv3-tiny)为基础框架,融合其浅层特征与第2 YOLO预测层特征作为第3预测层,通过更小的预选框增加小目标表征能力;在网络关键位置的特征图中混合使用注意力机制中的挤压激励注意模块(Squeeze and excitation attention module,SEAM)与卷积块注意模块(Convolutional block attention module,CBAM),通过强化检测目标关注以提高抗背景干扰能力。建立了室外环境下含农机与行人的共9 405幅图像的原始数据集。其中训练集7 054幅,测试集2 351幅。测试表明本文模型的内存约为YOLOv3与单次多重检测器(Single shot multibox detector,SSD)模型内存的1/3和2/3;与YOLOv3-...
【文章来源】:农业机械学报. 2020,51(S1)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
YOLOv3? tiny的漏检现象
不同于常规YOLOv3应用中需用比较深的网络来拟合几十甚至上百个目标,本文检测任务只包含行人和农机两类障碍物,YOLOv3 tiny中残差模块的缺位与大量卷积层的减少并不会对本文检测任务的检测准确率有显著影响。但为了克服YOLOv3tiny中浅层低维特征在网络深层丢失并因此产生的漏检,本文构建融合浅层信息的YOLO预测层y3。如图2所示,将YOLOv3 tiny的浅层网络与y2预测层之前的拼接层进行融合构建一个新的尺寸为52×52的y3预测层。y3预测层的特征信息来自浅层信息与y2结构路线拼接前的特征图。融合了浅层特征图的y3包含了更多的图像低维特征信息。如图3所示,y1小尺度YOLO层13×13的每个网格生成的预测框比较大,y2其次,而远距离行人、农机,需要更小的预测框在y3预测层预测。在本文构建的预测层y3中,输入原图像被划分为52×52个网格,每个网格与y3预测层的每个通道一一对应。每个网格根据对应通道信息生成3个尺寸预先设置好的预选框,在训练时不断调整大小并优选出合适的预选框作为输出结果[12]。各个预测层通道包含了每个网格最终的预测参数。如图3中以y1预测层为例,每个通道分别由预测框中心坐标(tx,ty)、预测框长宽尺寸(tw,th)、预选框的预测置信度p0、农机的预测得分s1和行人的预测得分s2组成。每个网格生成3个预选框,每个预选框包含以上7个参数,故y1、y2、y3预测层预测输出通道维数均为21。
如图3所示,y1小尺度YOLO层13×13的每个网格生成的预测框比较大,y2其次,而远距离行人、农机,需要更小的预测框在y3预测层预测。在本文构建的预测层y3中,输入原图像被划分为52×52个网格,每个网格与y3预测层的每个通道一一对应。每个网格根据对应通道信息生成3个尺寸预先设置好的预选框,在训练时不断调整大小并优选出合适的预选框作为输出结果[12]。各个预测层通道包含了每个网格最终的预测参数。如图3中以y1预测层为例,每个通道分别由预测框中心坐标(tx,ty)、预测框长宽尺寸(tw,th)、预选框的预测置信度p0、农机的预测得分s1和行人的预测得分s2组成。每个网格生成3个预选框,每个预选框包含以上7个参数,故y1、y2、y3预测层预测输出通道维数均为21。1.3 先空间后通道的混合注意力机制
【参考文献】:
期刊论文
[1]基于毫米波雷达的植保无人机避障系统研究[J]. 孙柯,吴开华,王亚涛,邵振程. 传感器与微系统. 2020(06)
[2]自然场景下的挖掘机实时监测方法[J]. 毛亮,薛月菊,朱婷婷,魏颖慧,何俊乐,朱勋沐. 农业工程学报. 2020(09)
[3]基于改进型YOLO的复杂环境下番茄果实快速识别方法[J]. 刘芳,刘玉坤,林森,郭文忠,徐凡,张白. 农业机械学报. 2020(06)
[4]Tiny YOLOV3目标检测改进[J]. 马立,巩笑天,欧阳航空. 光学精密工程. 2020(04)
[5]基于毫米波雷达和摄像头的农用车辆障碍物检测[J]. 宋正根,彭竟德,肖璨. 现代信息科技. 2019(14)
[6]基于激光雷达的农田环境点云采集系统设计[J]. 季宇寒,徐弘祯,张漫,李世超,曹如月,李寒. 农业机械学报. 2019(S1)
[7]基于增强Tiny YOLOV3算法的车辆实时检测与跟踪[J]. 刘军,后士浩,张凯,张睿,胡超超. 农业工程学报. 2019(08)
[8]水田田埂边界支持向量机检测方法[J]. 蔡道清,李彦明,覃程锦,刘成良. 农业机械学报. 2019(06)
[9]基于改进SSD的果园行人实时检测方法[J]. 刘慧,张礼帅,沈跃,张健,吴边. 农业机械学报. 2019(04)
[10]多类农田障碍物卷积神经网络分类识别方法[J]. 薛金林,闫嘉,范博文. 农业机械学报. 2018(S1)
本文编号:3509947
【文章来源】:农业机械学报. 2020,51(S1)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
YOLOv3? tiny的漏检现象
不同于常规YOLOv3应用中需用比较深的网络来拟合几十甚至上百个目标,本文检测任务只包含行人和农机两类障碍物,YOLOv3 tiny中残差模块的缺位与大量卷积层的减少并不会对本文检测任务的检测准确率有显著影响。但为了克服YOLOv3tiny中浅层低维特征在网络深层丢失并因此产生的漏检,本文构建融合浅层信息的YOLO预测层y3。如图2所示,将YOLOv3 tiny的浅层网络与y2预测层之前的拼接层进行融合构建一个新的尺寸为52×52的y3预测层。y3预测层的特征信息来自浅层信息与y2结构路线拼接前的特征图。融合了浅层特征图的y3包含了更多的图像低维特征信息。如图3所示,y1小尺度YOLO层13×13的每个网格生成的预测框比较大,y2其次,而远距离行人、农机,需要更小的预测框在y3预测层预测。在本文构建的预测层y3中,输入原图像被划分为52×52个网格,每个网格与y3预测层的每个通道一一对应。每个网格根据对应通道信息生成3个尺寸预先设置好的预选框,在训练时不断调整大小并优选出合适的预选框作为输出结果[12]。各个预测层通道包含了每个网格最终的预测参数。如图3中以y1预测层为例,每个通道分别由预测框中心坐标(tx,ty)、预测框长宽尺寸(tw,th)、预选框的预测置信度p0、农机的预测得分s1和行人的预测得分s2组成。每个网格生成3个预选框,每个预选框包含以上7个参数,故y1、y2、y3预测层预测输出通道维数均为21。
如图3所示,y1小尺度YOLO层13×13的每个网格生成的预测框比较大,y2其次,而远距离行人、农机,需要更小的预测框在y3预测层预测。在本文构建的预测层y3中,输入原图像被划分为52×52个网格,每个网格与y3预测层的每个通道一一对应。每个网格根据对应通道信息生成3个尺寸预先设置好的预选框,在训练时不断调整大小并优选出合适的预选框作为输出结果[12]。各个预测层通道包含了每个网格最终的预测参数。如图3中以y1预测层为例,每个通道分别由预测框中心坐标(tx,ty)、预测框长宽尺寸(tw,th)、预选框的预测置信度p0、农机的预测得分s1和行人的预测得分s2组成。每个网格生成3个预选框,每个预选框包含以上7个参数,故y1、y2、y3预测层预测输出通道维数均为21。1.3 先空间后通道的混合注意力机制
【参考文献】:
期刊论文
[1]基于毫米波雷达的植保无人机避障系统研究[J]. 孙柯,吴开华,王亚涛,邵振程. 传感器与微系统. 2020(06)
[2]自然场景下的挖掘机实时监测方法[J]. 毛亮,薛月菊,朱婷婷,魏颖慧,何俊乐,朱勋沐. 农业工程学报. 2020(09)
[3]基于改进型YOLO的复杂环境下番茄果实快速识别方法[J]. 刘芳,刘玉坤,林森,郭文忠,徐凡,张白. 农业机械学报. 2020(06)
[4]Tiny YOLOV3目标检测改进[J]. 马立,巩笑天,欧阳航空. 光学精密工程. 2020(04)
[5]基于毫米波雷达和摄像头的农用车辆障碍物检测[J]. 宋正根,彭竟德,肖璨. 现代信息科技. 2019(14)
[6]基于激光雷达的农田环境点云采集系统设计[J]. 季宇寒,徐弘祯,张漫,李世超,曹如月,李寒. 农业机械学报. 2019(S1)
[7]基于增强Tiny YOLOV3算法的车辆实时检测与跟踪[J]. 刘军,后士浩,张凯,张睿,胡超超. 农业工程学报. 2019(08)
[8]水田田埂边界支持向量机检测方法[J]. 蔡道清,李彦明,覃程锦,刘成良. 农业机械学报. 2019(06)
[9]基于改进SSD的果园行人实时检测方法[J]. 刘慧,张礼帅,沈跃,张健,吴边. 农业机械学报. 2019(04)
[10]多类农田障碍物卷积神经网络分类识别方法[J]. 薛金林,闫嘉,范博文. 农业机械学报. 2018(S1)
本文编号:3509947
本文链接:https://www.wllwen.com/nykjlw/nygclw/3509947.html