当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习算法的水果图像目标分类与检测研究

发布时间:2020-07-16 04:37
【摘要】:改革开放以来,我国水果种植面积不断扩大,水果产量不断提升,然而,过去大部分的水果采摘作业基本依靠人工,而从事农业生产的人员又在不断缩减,为应对农业生产中人力不足的必然发展趋势,开发具有识别与定位功能的采摘机器人符合社会发展需要,将给社会发展带来巨大的经济效益和广阔的市场前景。近年来,随着深度学习的迅速发展和崛起,尤其其在视觉方向取得了巨大的成就,相比传统的识别算法,深度学习在对目标识别的特征描述上能力更强。因此,开发基于深度学习算法视觉识别功能的采摘机器人具有重大意义。首先,本文基于当前先进的深度学习算法进行实验探究,提出了基于卷积神经网络的水果图像分类识别算法,主要参照经典的卷积神经网络模型LeNet-5结构,提出新的卷积神经网络结构并对苹果、梨、橙子、橘子、桃子五种水果进行分类识别,该模型构建了一个输入层、两个卷积层、两个池化层、两个全连接层和一个输出层。实验结果表明,所提出的卷积神经网络结构不仅在数据集上取得了96.88%的识别准确率,相比原始的LeNet-5模型获得的准确率更高,收敛速度更快。其次,本文对水果图像识别又进行了更为深入的研究,基于深度学习目标检测算法,为论证算法的可行性,选取苹果图像作为具体的研究对象,而当前主流的深度学习目标检测算法有Faster-RCNN、YOLO、SSD,本文的检测算法采用基于区域建议的Faster-RCNN,通过该算法来对图像中的苹果进行识别与定位研究。为应对自然场景下苹果目标可能出现的遮挡、重叠、逆光、表面光照不均等情况,在采集图像时,拍摄了包含不同尺寸大小、数量以及不同光照角度的苹果图像,通过选取本文提出的改进的LeNet-5和经典的卷积神经网络VGG16以及ResNet101为基础提取网络并进行建模对比,探讨不同框架模型下的检测效果,通过多次设定不同的超参数组合并进行模型的精度对比,以此来得到了合适的超参数组合,最终在基于ResNet101的Faster-RCNN苹果检测模型上得到了90.91%的平均检测精度,而在以本文提出的改进LeNet-5模型上获得的检测精度太低,又相比以VGG16为基础提取网络的模型,基于ResNet101的模型在平均检测精度上得到了明显的提升,虽然在检测速度上逊色于VGG16,检测一幅图像的时间为0.39秒,但已经达到了实时性的要求,并且得到了98.96%的查全率和85.74%的召回率,通过最后的实验测试表明,该模型可用于对树上苹果的检测,验证了算法的可行性,也为研究检测其他种类的水果提供了经验。
【学位授予单位】:南华大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:S225.93;TP391.41;TP18
【图文】:

物品,能速,机器人,服务机器人


南华大学硕士学位论文向上更迈进了一步。图 1.1 所示是加州大学研究人员和西门子公司研究小组研发的新型机器人 Dex Net2.0[10],该新型机器人先是深入的了解并研究了虚据库中不同特征的三维物品,共计 10000 个,通过自带的深度学习系统就能速的对物品进行预判,从而选取相应的方法来抓取各种不规则形状的物品凭借其出色的功能,这款机器人能够在医疗方面进行广泛的使用,也可用于服务机器人以及农业采摘机器人。

神经网络,学习过程


第 1 章 绪论学习中的“学习”也是核心问题之一,简单来讲,即为自动的将更加复杂的特征,并利用这些组合特征解决问题。以卷积神经网可以从图像的像素特征逐渐组合线、边、角、简单形状、复杂复杂特征。出学习的过程即为权重更新过程,通过正向传播和以损失函数的渐小为目标,不断沿着梯度的反方向更新权重的适。学习过程中,采用激活函数去除模型线性化,引入正则化以及采用梯度下降算法、学习率衰减算法等方法对学习过程进

网络结构图,学习模型,学习参数,冠军


图 1.3 LeNet-5 网络结构图Figure 1.3 LeNet-5 network structure diagram往后的十多年里,越来越多的新型卷积神经网络模型被提出,其中比较型有:AlexNet、ZFNet、VGGNet、GoogleNet、ResNet。AlexNet[24]是由 Alex Krizhevsky 提出的一个深度学习模型,并赢得了视觉领域竞赛C2012[25]的冠军,并且大幅度超过传统的方法,在百万量级的 ImageNe上,识别率从传统的 70%多提升到了 80%多,top5 预测的错误率为 16.4一名,将深度学习正式推上了舞台。AlexNet 为 8 层结构,其中前 5 层,后面 3 层为全连接层,在两个 GPU 上运行,其中学习参数有大约 6神经元有 650000 个左右,由于当时是对 1000 个类别进行分类,所以在后输出是 1000 个类别的概率值,其中 AlexNet 的网络结构图如下图 1

【相似文献】

相关期刊论文 前10条

1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期

2 刘高宇;;深度神经网络在煤质数据分析与预测中的应用[J];电脑知识与技术;2019年28期

3 冯伟业;廖可非;欧阳缮;牛耀;;基于胶囊神经网络的合成孔径雷达图像分类方法[J];科学技术与工程;2019年28期

4 温赞扬;;基于群智优化神经网络的音乐风格分类模型研究[J];现代电子技术;2019年21期

5 郑丽;;建筑设计中神经网络技术与遗传算法探究[J];湖北农机化;2019年21期

6 易炜;何嘉;邹茂扬;;基于循环神经网络的对话系统记忆机制[J];计算机工程与设计;2019年11期

7 黄为;李永刚;胡上成;汪毅;;基于循环神经网络的船摇数据实时预测[J];科学技术与工程;2019年31期

8 赖策;魏小琴;;卷积神经网络的训练方式研究[J];信息与电脑(理论版);2019年22期

9 周济民;;基于神经网络改进的元胞自动机分析——美国阿片类药物滥用情况[J];信息系统工程;2019年11期

10 马猛;王明红;;基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J];轻工机械;2019年06期

相关会议论文 前10条

1 孙军田;张U

本文编号:2757528


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2757528.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户52570***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com