基于改进LeNet和Qlearning的图像分类算法研究及应用
发布时间:2021-07-03 12:42
随着人们生活水平的不断提高,小龙虾不仅是风味小吃的一个新方向而且由于其体内含有大量虾青素也可以制作为药品来预防疾病。但是目前对于小龙虾的分类依然停留在人工检测阶段,不仅浪费人力资源而且识别准确率不高,进而导致小龙虾食品和药品安全问题。因此,对于龙虾的全自动加工、分类检测存在巨大的市场前景。本文研究关于图像分类算法,主要目的为设计一套包含卷积神经网络、对抗式神经网络、强化学习的算法来自动剔除黑虾、受损严重的虾和煮熟前死虾等问题虾。本文主要工作如下:(1)针对小数据集提出一种改进LeNet模型,解决了传统卷积神经网络LeNet模型准确率低、收敛速度慢,以及VggNet等模型过拟合问题。该模型在LeNet基础上使用ReLU函数替换Sigmoid来提高收敛速度,加入1*1卷积增加模型深度并利用其改变维度的特点来提高识别准确率,通过分解卷积和提出改进Dropout方法减少过拟合。实验结果表明:改进LeNet模型分类自制小龙虾数据集,比LeNet收敛速度快6000步并且准确率提高约15%,比VggNet和ResNet过拟合程度明显减少。(2)提出改进GAN模型解决了采集得到的图像数据量过少,以及G...
【文章来源】:湖北工业大学湖北省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
LeNet结构图
湖北工业大学硕士学位论文132.2.4ResNet网络模型2015年HEKaiming等人为解决模型加深难以训练的问题提出了ResNet[50]。该模型采用名为残差的新型结构,根据输入和输出的差别来学习训练网络,有效的解决了在卷积网络信息传递过程中信息丢失和模型训练的问题。传统的神经网络是学习输入到输出的映射H(x),而残差网络学习到的是F(x)=H(x)x。这样可以避免学习从x到H(x)的直接映射关系,而是学习两者之间的差异,其中将差异逼近到0相对容易。残差网络模块由图2.8可见,以ResNet18为例,其结构图由图2.9可见。convconv图2.8残差模块结构图图2.9ResNet18结构图2.3改进LeNet模型设计及应用为了在采集所得小龙虾这类数据量少、类别少的小数据集上有好的分类能力,在LeNet模型基础上主要做出如下改进。使用ReLU激活函数替换Sigmoid提高模型收敛速度。增加1*1卷积模块,增加模型深度的同时能够改变维度从而提高准确率。分解5*5卷积和加入改进Dropout方法来减少过拟合。2.3.1加快收敛速度改进LeNet模型中使用ReLU函数替换LeNet模型的Sigmoid函数,加快模型训练的收敛速度。Sigmoid函数曲线以及函数的导数曲线图见图2.10,图中实线表示函数曲线,虚线表示导数曲线。Sigmoid函数的优点是将输出映射在(0,1)之间,适用于二分类。在反向传播求误差梯度时需要对Sigmoid函数求导,但是Sigmoid函数存在当
湖北工业大学硕士学位论文14x>0时,随着输入的不断增大导数趋近于0,导致反向传播过程中容易出现梯度消失模型收敛速度慢的问题。(a)Sigmoid函数曲线(b)Sigmoid导数曲线图2.10Sigmoid函数以及导数曲线ReLU函数曲线以及函数的导数曲线图见图2.11。该函数当x>0时导数值始终为1,反向传播过程中不会出现梯度消失的情况,卷积神经网络收敛速度快。(a)ReLU函数曲线(b)ReLU导数曲线图2.11ReLU函数以及导数曲线2.3.2提高准确率为提高模型分类准确率,改进LeNet模型中添加了1*1卷积模块,该模块在本文中有以下三个特点。第一,增加模型深度。VggNet中堆叠3*3小卷积来不断增加网络深度,实验证明网络深度对分类准确率有正面影响。改进LeNet模型通过添加1*1卷积模块加深网络,不仅能够提高准确率而且训练参数比3*3卷积少。第二,增强模型非线性。卷积运算由矩阵乘法运算和加法组成,是线性运算。处理图像分类为非线性问题,故卷积层之后通常需要加入非线性激活函数将线性运算转化为非线性。添加1*1卷积模块可以保持图片分辨率不变的条件下加强模型的非线性,从而提高模型提取特征的能力。表2.13种卷积操作的参数计算表3种卷积操作参数计算10*10*10和5*5*20卷积500010*10*10和1*1*5卷积之后再与5*5*20卷积255010*10*10和1*1*15卷积之后再与5*5*20卷积7650第三,改变维度。在卷积核大小为10*10深度为10与卷积核大小为5*5深度
【参考文献】:
期刊论文
[1]基于马尔科夫决策过程的多传感器协同检测与跟踪调度方法[J]. 徐公国,单甘霖,段修生,乔成林,王浩天. 电子与信息学报. 2019(09)
[2]基于深度强化学习的车辆跟驰控制[J]. 朱冰,蒋渊德,赵健,陈虹,邓伟文. 中国公路学报. 2019(06)
[3]生成式对抗网络在图像补全中的应用[J]. 时澄,潘斌,郭小明,李芹芹,张露月,钟凡. 计算机科学与探索. 2019(08)
[4]深度学习在文字识别领域的应用[J]. 李新炜,殷韶坤. 电子技术与软件工程. 2018(24)
[5]基于值函数和策略梯度的深度强化学习综述[J]. 刘建伟,高峰,罗雄麟. 计算机学报. 2019(06)
[6]人工智能研究的新前线:生成式对抗网络[J]. 林懿伦,戴星原,李力,王晓,王飞跃. 自动化学报. 2018(05)
[7]基于深度生成式对抗网络的蓝藻语义分割[J]. 杨朔,陈丽芳,石瑀,毛一鸣. 计算机应用. 2018(06)
[8]生成式对抗网络GAN的研究进展与展望[J]. 王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃. 自动化学报. 2017(03)
[9]基于深度学习的语音识别技术现状与展望[J]. 戴礼荣,张仕良,黄智颖. 数据采集与处理. 2017(02)
[10]基于深度学习的图像检索系统[J]. 胡二雷,冯瑞. 计算机系统应用. 2017(03)
硕士论文
[1]基于生成式对抗网络的图像修复算法研究[D]. 赵立怡.西安理工大学 2018
[2]基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学 2016
[3]基于深度学习的语音识别应用研究[D]. 张建华.北京邮电大学 2015
[4]深度学习在图像识别中的研究及应用[D]. 李卫.武汉理工大学 2014
[5]基于人工智能机器学习的文字识别方法研究[D]. 李雷.电子科技大学 2013
本文编号:3262602
【文章来源】:湖北工业大学湖北省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
LeNet结构图
湖北工业大学硕士学位论文132.2.4ResNet网络模型2015年HEKaiming等人为解决模型加深难以训练的问题提出了ResNet[50]。该模型采用名为残差的新型结构,根据输入和输出的差别来学习训练网络,有效的解决了在卷积网络信息传递过程中信息丢失和模型训练的问题。传统的神经网络是学习输入到输出的映射H(x),而残差网络学习到的是F(x)=H(x)x。这样可以避免学习从x到H(x)的直接映射关系,而是学习两者之间的差异,其中将差异逼近到0相对容易。残差网络模块由图2.8可见,以ResNet18为例,其结构图由图2.9可见。convconv图2.8残差模块结构图图2.9ResNet18结构图2.3改进LeNet模型设计及应用为了在采集所得小龙虾这类数据量少、类别少的小数据集上有好的分类能力,在LeNet模型基础上主要做出如下改进。使用ReLU激活函数替换Sigmoid提高模型收敛速度。增加1*1卷积模块,增加模型深度的同时能够改变维度从而提高准确率。分解5*5卷积和加入改进Dropout方法来减少过拟合。2.3.1加快收敛速度改进LeNet模型中使用ReLU函数替换LeNet模型的Sigmoid函数,加快模型训练的收敛速度。Sigmoid函数曲线以及函数的导数曲线图见图2.10,图中实线表示函数曲线,虚线表示导数曲线。Sigmoid函数的优点是将输出映射在(0,1)之间,适用于二分类。在反向传播求误差梯度时需要对Sigmoid函数求导,但是Sigmoid函数存在当
湖北工业大学硕士学位论文14x>0时,随着输入的不断增大导数趋近于0,导致反向传播过程中容易出现梯度消失模型收敛速度慢的问题。(a)Sigmoid函数曲线(b)Sigmoid导数曲线图2.10Sigmoid函数以及导数曲线ReLU函数曲线以及函数的导数曲线图见图2.11。该函数当x>0时导数值始终为1,反向传播过程中不会出现梯度消失的情况,卷积神经网络收敛速度快。(a)ReLU函数曲线(b)ReLU导数曲线图2.11ReLU函数以及导数曲线2.3.2提高准确率为提高模型分类准确率,改进LeNet模型中添加了1*1卷积模块,该模块在本文中有以下三个特点。第一,增加模型深度。VggNet中堆叠3*3小卷积来不断增加网络深度,实验证明网络深度对分类准确率有正面影响。改进LeNet模型通过添加1*1卷积模块加深网络,不仅能够提高准确率而且训练参数比3*3卷积少。第二,增强模型非线性。卷积运算由矩阵乘法运算和加法组成,是线性运算。处理图像分类为非线性问题,故卷积层之后通常需要加入非线性激活函数将线性运算转化为非线性。添加1*1卷积模块可以保持图片分辨率不变的条件下加强模型的非线性,从而提高模型提取特征的能力。表2.13种卷积操作的参数计算表3种卷积操作参数计算10*10*10和5*5*20卷积500010*10*10和1*1*5卷积之后再与5*5*20卷积255010*10*10和1*1*15卷积之后再与5*5*20卷积7650第三,改变维度。在卷积核大小为10*10深度为10与卷积核大小为5*5深度
【参考文献】:
期刊论文
[1]基于马尔科夫决策过程的多传感器协同检测与跟踪调度方法[J]. 徐公国,单甘霖,段修生,乔成林,王浩天. 电子与信息学报. 2019(09)
[2]基于深度强化学习的车辆跟驰控制[J]. 朱冰,蒋渊德,赵健,陈虹,邓伟文. 中国公路学报. 2019(06)
[3]生成式对抗网络在图像补全中的应用[J]. 时澄,潘斌,郭小明,李芹芹,张露月,钟凡. 计算机科学与探索. 2019(08)
[4]深度学习在文字识别领域的应用[J]. 李新炜,殷韶坤. 电子技术与软件工程. 2018(24)
[5]基于值函数和策略梯度的深度强化学习综述[J]. 刘建伟,高峰,罗雄麟. 计算机学报. 2019(06)
[6]人工智能研究的新前线:生成式对抗网络[J]. 林懿伦,戴星原,李力,王晓,王飞跃. 自动化学报. 2018(05)
[7]基于深度生成式对抗网络的蓝藻语义分割[J]. 杨朔,陈丽芳,石瑀,毛一鸣. 计算机应用. 2018(06)
[8]生成式对抗网络GAN的研究进展与展望[J]. 王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃. 自动化学报. 2017(03)
[9]基于深度学习的语音识别技术现状与展望[J]. 戴礼荣,张仕良,黄智颖. 数据采集与处理. 2017(02)
[10]基于深度学习的图像检索系统[J]. 胡二雷,冯瑞. 计算机系统应用. 2017(03)
硕士论文
[1]基于生成式对抗网络的图像修复算法研究[D]. 赵立怡.西安理工大学 2018
[2]基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学 2016
[3]基于深度学习的语音识别应用研究[D]. 张建华.北京邮电大学 2015
[4]深度学习在图像识别中的研究及应用[D]. 李卫.武汉理工大学 2014
[5]基于人工智能机器学习的文字识别方法研究[D]. 李雷.电子科技大学 2013
本文编号:3262602
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3262602.html