基于深度学习的苹果目标识别与定位算法研究
发布时间:2021-03-07 09:38
苹果是我国种植面积最大、产量最高、经济地位最重要的水果。到目前为止,苹果采摘仍然以人工采摘为主,苹果在成熟期内采摘量大、人工采摘劳动强度大,每天采摘量有限,且人工劳动成本高,如果不能尽快采摘将会导致苹果掉落在地,影响苹果质量。苹果快速自动化采摘可以极大地提高苹果采摘效率,降低人工劳动成本,苹果目标识别与定位是苹果快速自动化采摘的关键技术之一,对实现苹果快速自动化采摘具有非常重要的意义。针对自然环境下苹果采摘机器人的应用需求,结合图像处理技术,提出一种基于深度学习的苹果目标识别与定位算法。主要研究内容如下:(1)基于苹果目标识别的图像处理方法研究。为了提高苹果目标的识别率,采集了11080幅自然环境中的苹果图像。并对RGB、HSI和Lab的差别进行了分析与对比,并选取了最为适合的RGB颜色空间。另外对图像进行滤波处理,并对去噪效果进行对比分析。最终利用LabelImg软件对处理后的图像进行位置标定,建立了训练集与测试集。(2)基于MobileNetV1网络的苹果目标特征提取研究。通过对卷积神经网络的流程介绍和对VGG网络、ResNet残差网络、MobileNetV1网络的优缺点分析,最终...
【文章来源】:浙江工业大学浙江省
【文章页数】:98 页
【学位级别】:硕士
【部分图文】:
苹果采摘视觉系统技术路线图
基于深度学习的苹果目标识别与定位算法研究152.3.4颜色空间分析结果首先由于相机所拍摄的图像为RGB图像,如果将其转换为HSI颜色空间或者Lab颜色空间都需要消耗一定的时间来完成,但是自动苹果采摘机器人需要考虑实时性。因此时间的消耗是一定要考虑的重要因素之一。由于获得的图像在经过一定处理后需要进行卷积操作,卷积会对图像的每一个通道都进行特征提取,因此原始图像的每一个通道若都拥有明显的特征信息,会对后续的图像训练与目标识别准确率的提高有明显的帮助。通过对上文中三种颜色通道的对比分析,可以发现RGB每一个通道的图像苹果与背景的差异都比较明显,并且保留了丰富的纹理特征。HSI图像只有I通道的图像能够较好的将苹果与背景分割出来,并且保留较好的纹理特征。而Lab图像只有L通道的图像能够较好的将苹果与背景分割出来,同时保留较好的纹理信息。因此本文将采用RGB图像来完成苹果的目标检测与识别。2.4图像预处理对于自然环境中拍摄获得的图像将存在大量的噪声,噪声会淹没一些特征信息,使得苹果与背景对比度下降,造成深度学习模型提取特征困难。因此要在正式图像训练前进行一定的预处理,减少噪声对于深度学习模型的影响,从而加快模型的收敛速度,使得模型有更好的效果。图像滤波操作[54]可以抑制图像中的噪声,而在本文中还减少了背景对于模型训练的影响。常见的滤波器有线性滤波与非线性滤波。2.4.1线性滤波器(1)均值滤波:均值滤波是最简单的一种滤波操作,主要方法是领域平均法。也就是用一片图像区域内的像素的平均值去代替原先图像中各个像素值,均值滤波的数学表达式如下所示。()()fx,ygx,yM(2-2)式中,g——新的像素值;f——原图像的像素值;M——领域的像素个数。但是均值滤波也存
18图2-7LabelImg标注图像Figure2-7.LabelImgannotationimage使用该软件对图像进行标注之后,会形成一个xml文件。里面存储了图片的路径,图片的大小和通道数,以及每一个目标物体的类别名称和包围目标物体的矩形的左上角与右下角像素点坐标。图2-8LabelImg标注代码Figure2-8.LabelImgannotationcode
本文编号:3068837
【文章来源】:浙江工业大学浙江省
【文章页数】:98 页
【学位级别】:硕士
【部分图文】:
苹果采摘视觉系统技术路线图
基于深度学习的苹果目标识别与定位算法研究152.3.4颜色空间分析结果首先由于相机所拍摄的图像为RGB图像,如果将其转换为HSI颜色空间或者Lab颜色空间都需要消耗一定的时间来完成,但是自动苹果采摘机器人需要考虑实时性。因此时间的消耗是一定要考虑的重要因素之一。由于获得的图像在经过一定处理后需要进行卷积操作,卷积会对图像的每一个通道都进行特征提取,因此原始图像的每一个通道若都拥有明显的特征信息,会对后续的图像训练与目标识别准确率的提高有明显的帮助。通过对上文中三种颜色通道的对比分析,可以发现RGB每一个通道的图像苹果与背景的差异都比较明显,并且保留了丰富的纹理特征。HSI图像只有I通道的图像能够较好的将苹果与背景分割出来,并且保留较好的纹理特征。而Lab图像只有L通道的图像能够较好的将苹果与背景分割出来,同时保留较好的纹理信息。因此本文将采用RGB图像来完成苹果的目标检测与识别。2.4图像预处理对于自然环境中拍摄获得的图像将存在大量的噪声,噪声会淹没一些特征信息,使得苹果与背景对比度下降,造成深度学习模型提取特征困难。因此要在正式图像训练前进行一定的预处理,减少噪声对于深度学习模型的影响,从而加快模型的收敛速度,使得模型有更好的效果。图像滤波操作[54]可以抑制图像中的噪声,而在本文中还减少了背景对于模型训练的影响。常见的滤波器有线性滤波与非线性滤波。2.4.1线性滤波器(1)均值滤波:均值滤波是最简单的一种滤波操作,主要方法是领域平均法。也就是用一片图像区域内的像素的平均值去代替原先图像中各个像素值,均值滤波的数学表达式如下所示。()()fx,ygx,yM(2-2)式中,g——新的像素值;f——原图像的像素值;M——领域的像素个数。但是均值滤波也存
18图2-7LabelImg标注图像Figure2-7.LabelImgannotationimage使用该软件对图像进行标注之后,会形成一个xml文件。里面存储了图片的路径,图片的大小和通道数,以及每一个目标物体的类别名称和包围目标物体的矩形的左上角与右下角像素点坐标。图2-8LabelImg标注代码Figure2-8.LabelImgannotationcode
本文编号:3068837
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiyanjiusheng/3068837.html