基于迁移学习的箱包五金件图像识别方法及其应用研究
发布时间:2021-12-01 22:30
箱包制造企业在生成各类各款箱包产品时不仅离不开五金件而且使用率极高。但目前这些生产箱包的规模不大的中小企业进行五金件选择时基本采用的是人工挑选需要的五金件。人工挑选五金件不仅导致企业成本上升,而且影响产品的生产效率,从而影响企业的经营成本提升和利润降低。因此,研发一套能自动挑选箱包产品需要的五金件的系统是有应用价值的。本文基于箱包企业常用的五金件图像研究一种有效的五金件图像进行图像识别模型和研发一个基于Web的箱包五金件图像识别系统。具体研究工作和取得的阶段性成果说明如下。1、研究分析了深度学习的四个模型和箱包五金件图像数据集的特点。首先,较深入研究分析AlexNet网络、GoogLeNet网络、ResNet网络、MobileNet网络这四个先进的深度学习模型,并研究基于这些模型实现迁移学习模型的技术。其次,研究箱包五金件图像数据集并对数据集进行预处理和层次化,以更好训练有效的基于迁移学习的箱包五金件图像识别模型。2、提出了基于迁移学习的箱包五金件图像识别模型。针对目前从箱包企业采集到的五金件图像数据集不够大,为了更有效地实现基于深度学习进行箱包五金件图像识别,本文在对深度学习尤其是迁...
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2.1?AlexNet的网络结构图??
卷积核,分别是1x1,3x3,?5x5,而且在卷积层中采用了不同的填充值,??还使用了相同的步长1,卷积后可以使得维度的特征一样。在特征响应图的后??面,Inception模型连接了?3个不同卷积核大小的卷积层与一个池化层,然后在??进行非线性变化的时候使用了?ReLU激活函数,最后将所有的组装输出。在图??2.2中可以看到inception结构进行特征提取时使用了?4种不同的核,而且还采用??了?1x1卷积核进行稀疏传输,这样可以减少参数的计算量。??GoogLeNet的整体架构如图2.3所7K,GoogLeNet?—共含有了?9个inception??模块,而且每个卷积层后面都加上ReLu激活函数,在inception模块也同样使??用了?ReLu激活函数。GoogLeNet中含有的inception模块进行通道降维时在卷??积之前使用1x1卷积,是因为多个卷积层会使得输出时特征响应图通道堆叠,??特征变得臃肿,这样无疑加大了参数的计算量。从图中可以看出,1x1卷积,??3x3卷积和5x5卷积后面连接的是输出的通道数,在GoogLeNet网络中一共使??用了3个损失函数计算单元,在反向传播中,会出现梯度消失的问题,为了有??效的解决此问题,可以在中间层加入损失单元,这样可以加快模型的收敛速??度,使得更好的训练网络。在训练网络的过程中最终的损失函数是权重0.3与??中间的两个损失单元相乘,然后计算结果加到最后输出的损失单元中。??./?(?77?-?//??.111.1内?W?W?!?/!?'!.?!?N?M?|?4|?|IU;?P-UK4|||??|?|K?|?,,,?!??:,臟?U?-:?—」
训练出来的。ResNet网络的动机是网络退化问题,即传统网??络随着层数增多,准确率不升反降。ResNet使用恒等映射(Identity?mapping)收敛??速度更快,而且还不额外增加参数。在网络中某一位置添加一条shortcut??connection,将前层的特征直接传递过来,这个新连接称为Identity?mapping,如图??2.4所示:??■■??weight?layer?\??JT(X)?jrelu?x??weighjlayer?1?J?identity??图2.4残差单元??假设;c,代表第f层输入的特征响应图,F〇c,)代表预测值,在图2.4的结构??中,第〖层输出和第/?+?fl层的输出公式如下:??^■+1?+?^?(2-5)??n-\??xi+n=xi+yZ(xi+J)?(2.6)??7=〇??ResNet网络比较常用的是50-layer,101-layer,?152-layer。他们都是由上述??的残差模块堆叠在一起实现的。下面使用50-layer的ResNet作为例子,其结构??如表2.1所示:??表2.1?ResNet-50网络结构??过滤器?|输出尺寸?过滤器参数??Convl?112*112?7*7*64,?stride=2??Conv2_x?56*56?3*3?max?pooling,?stride?=2??10??
【参考文献】:
期刊论文
[1]基于迁移学习的语言文本识别分类研究与实现[J]. 杨显华,丁春利. 电子技术与软件工程. 2019(20)
[2]基于深度学习的图像检索研究[J]. 杨馥溢,何嘉. 计算机与数字工程. 2019(09)
[3]面向移动端的轻量化卷积神经网络结构[J]. 毕鹏程,罗健欣,陈卫卫,邓益侬,刘祯. 信息技术与网络安全. 2019(09)
[4]基于改进的卷积神经网络的交通标志检测与识别算法[J]. 卢飞宇. 工业控制计算机. 2019(06)
[5]基于卷积神经网络和迁移学习的色织物疵点检测[J]. 罗俊丽,路凯. 上海纺织科技. 2019(06)
[6]基于迁移学习的番茄叶片病害图像分类[J]. 王艳玲,张宏立,刘庆飞,张亚烁. 中国农业大学学报. 2019(06)
[7]基于深度神经网络的肺炎图像识别模型[J]. 何新宇,张晓龙. 计算机应用. 2019(06)
[8]基于深度学习的快速植物图像识别[J]. 张雪芹,陈嘉豪,诸葛晶晶,余丽君. 华东理工大学学报(自然科学版). 2018(06)
[9]基于卷积神经网络的手写汉字识别研究[J]. 杨佶. 信息技术与信息化. 2018(12)
[10]TensorFlow在图像识别系统中的应用[J]. 邢艳芳,段红秀,何光威. 计算机技术与发展. 2019(05)
硕士论文
[1]基于深度卷积神经网络的高光谱图像分类方法研究[D]. 陈采璐.哈尔滨工业大学 2019
[2]基于深度学习的五金件图像检索方法及其应用研究[D]. 何智海.南昌大学 2019
[3]基于迁移学习的人脸识别研究[D]. 姜慧.青岛科技大学 2018
[4]隧道裂缝图像智能匹配与变化趋势检测算法研究[D]. 王春薇.北京交通大学 2017
[5]基于图像分析的路面裂缝检测方法与识别研究[D]. 姜吉荣.南京邮电大学 2016
本文编号:3527179
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2.1?AlexNet的网络结构图??
卷积核,分别是1x1,3x3,?5x5,而且在卷积层中采用了不同的填充值,??还使用了相同的步长1,卷积后可以使得维度的特征一样。在特征响应图的后??面,Inception模型连接了?3个不同卷积核大小的卷积层与一个池化层,然后在??进行非线性变化的时候使用了?ReLU激活函数,最后将所有的组装输出。在图??2.2中可以看到inception结构进行特征提取时使用了?4种不同的核,而且还采用??了?1x1卷积核进行稀疏传输,这样可以减少参数的计算量。??GoogLeNet的整体架构如图2.3所7K,GoogLeNet?—共含有了?9个inception??模块,而且每个卷积层后面都加上ReLu激活函数,在inception模块也同样使??用了?ReLu激活函数。GoogLeNet中含有的inception模块进行通道降维时在卷??积之前使用1x1卷积,是因为多个卷积层会使得输出时特征响应图通道堆叠,??特征变得臃肿,这样无疑加大了参数的计算量。从图中可以看出,1x1卷积,??3x3卷积和5x5卷积后面连接的是输出的通道数,在GoogLeNet网络中一共使??用了3个损失函数计算单元,在反向传播中,会出现梯度消失的问题,为了有??效的解决此问题,可以在中间层加入损失单元,这样可以加快模型的收敛速??度,使得更好的训练网络。在训练网络的过程中最终的损失函数是权重0.3与??中间的两个损失单元相乘,然后计算结果加到最后输出的损失单元中。??./?(?77?-?//??.111.1内?W?W?!?/!?'!.?!?N?M?|?4|?|IU;?P-UK4|||??|?|K?|?,,,?!??:,臟?U?-:?—」
训练出来的。ResNet网络的动机是网络退化问题,即传统网??络随着层数增多,准确率不升反降。ResNet使用恒等映射(Identity?mapping)收敛??速度更快,而且还不额外增加参数。在网络中某一位置添加一条shortcut??connection,将前层的特征直接传递过来,这个新连接称为Identity?mapping,如图??2.4所示:??■■??weight?layer?\??JT(X)?jrelu?x??weighjlayer?1?J?identity??图2.4残差单元??假设;c,代表第f层输入的特征响应图,F〇c,)代表预测值,在图2.4的结构??中,第〖层输出和第/?+?fl层的输出公式如下:??^■+1?+?^?(2-5)??n-\??xi+n=xi+yZ(xi+J)?(2.6)??7=〇??ResNet网络比较常用的是50-layer,101-layer,?152-layer。他们都是由上述??的残差模块堆叠在一起实现的。下面使用50-layer的ResNet作为例子,其结构??如表2.1所示:??表2.1?ResNet-50网络结构??过滤器?|输出尺寸?过滤器参数??Convl?112*112?7*7*64,?stride=2??Conv2_x?56*56?3*3?max?pooling,?stride?=2??10??
【参考文献】:
期刊论文
[1]基于迁移学习的语言文本识别分类研究与实现[J]. 杨显华,丁春利. 电子技术与软件工程. 2019(20)
[2]基于深度学习的图像检索研究[J]. 杨馥溢,何嘉. 计算机与数字工程. 2019(09)
[3]面向移动端的轻量化卷积神经网络结构[J]. 毕鹏程,罗健欣,陈卫卫,邓益侬,刘祯. 信息技术与网络安全. 2019(09)
[4]基于改进的卷积神经网络的交通标志检测与识别算法[J]. 卢飞宇. 工业控制计算机. 2019(06)
[5]基于卷积神经网络和迁移学习的色织物疵点检测[J]. 罗俊丽,路凯. 上海纺织科技. 2019(06)
[6]基于迁移学习的番茄叶片病害图像分类[J]. 王艳玲,张宏立,刘庆飞,张亚烁. 中国农业大学学报. 2019(06)
[7]基于深度神经网络的肺炎图像识别模型[J]. 何新宇,张晓龙. 计算机应用. 2019(06)
[8]基于深度学习的快速植物图像识别[J]. 张雪芹,陈嘉豪,诸葛晶晶,余丽君. 华东理工大学学报(自然科学版). 2018(06)
[9]基于卷积神经网络的手写汉字识别研究[J]. 杨佶. 信息技术与信息化. 2018(12)
[10]TensorFlow在图像识别系统中的应用[J]. 邢艳芳,段红秀,何光威. 计算机技术与发展. 2019(05)
硕士论文
[1]基于深度卷积神经网络的高光谱图像分类方法研究[D]. 陈采璐.哈尔滨工业大学 2019
[2]基于深度学习的五金件图像检索方法及其应用研究[D]. 何智海.南昌大学 2019
[3]基于迁移学习的人脸识别研究[D]. 姜慧.青岛科技大学 2018
[4]隧道裂缝图像智能匹配与变化趋势检测算法研究[D]. 王春薇.北京交通大学 2017
[5]基于图像分析的路面裂缝检测方法与识别研究[D]. 姜吉荣.南京邮电大学 2016
本文编号:3527179
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3527179.html