基于多分辨率卷积神经网络的图像分类研究与应用

发布时间:2021-08-05 18:20
  卷积神经网络发展至今,在图像分类方面取得不俗的成就。随着硬件的迭代更新,卷积神经网络的研究发展依旧存在广阔的发展前景。当前的研究表明,卷积神经网络的深度和精度依旧是研究的难点。深层网络的分类精度高,但是复杂度和冗长性会导致实验的难度加大,而浅层网络的泛化性弱。为了解决这一难题,本文围绕优化卷积神经网络的结构,降低网络的复杂度的角度展开研究。主要工作包括:1、提出了在dense block结构中添加多分辨率因子的优化方法,提高了各层网络输出特征泛化能力和特征提取的效率,使重要特征更为显著,优化了特征提取过程中特征丢失的问题,提高future maps传递过程中的完整性,进一步提高网络模型的性能。解决了卷积神经网络在提取特征的过程中,特征提取不充分、特征丢失的问题。2、设计了在dense block结构间添加残差注意力机制网络的优化方案,增强了dense block结构间的显著特征,提高了特征提取的优化效果。解决了当前的深度学习通常需要从头开始训练,使用Finetune来学习新任务达不到预期效果的问题。3、利用蒸馏学习的特性,提出了自我蒸馏的优化方法,将网络层数较深的网络的权重模型移植到网... 

【文章来源】:湖北工业大学湖北省

【文章页数】:52 页

【学位级别】:硕士

【部分图文】:

基于多分辨率卷积神经网络的图像分类研究与应用


神经元结构图

神经网络,神经网络模型,隐含层,输入端


湖北工业大学硕士学位论文6多个神经元组合在一起,并形成一定的分层结构,我们称之为神经网络模型,如图2.2所示,这里是一个具有一个隐含层的神经网络。图2.2含有隐含层的神经网络图2.2是一个简单的神经网络模型,包含了三个输入端X1,X2,X3,另一个+1输入端表示阈值参与计算。三个输入端的输入数据分别与权重相乘,再与阈值相加,即得到我们的输出。其对应的公式为:)(a13132121111bxwxwxwf(2.2))(a23232221212bxwxwxwf(2.3))(a33332321313bxwxwxwf(2.4))(aaa)(332211321,bxwxwxwfxhbw(2.5)其中X1,X2,X3作为输入,b,b1,b2,b3作为阈值,W1,W2,W11,W12,W13等是权重,hw,b(x)是输出。卷积神经网络是一种前馈神经网络,其网络的显著特点是具有卷积计算和深度结构。卷积神经网络通过一层一层的节点组织起来的,网络中的每一个节点都是一个神经元,并且相邻的两层之间只有部分节点有连接。一方面减少参数数量、降低运算复杂性,裁掉重复冗长的无关计算,另一方面,提取关键信息和主体信息,使网络整体更为高效。如图2.3所示,卷积神经网络从架构上可以分为五个部分:输入层、卷积层、池化层、全连接层以及softmax层。这里先简单介绍输入层、卷积层、池化层、全连接层、softmax层的定义。后面着重介绍卷积层、池化层的基本原理。卷积神经网络最重要的结构是卷积层,能够实现卷积计算的卷积核是网络的关键部分。而池化层与之密切相关,在卷积神经网络结构不断发展的前提下,卷积层和池化层仍然是需要密切关注的部分。

架构图,卷积,神经网络,矩阵


湖北工业大学硕士学位论文7图2.3卷积神经网络架构图如图2.3所示,是卷积神经网络的一般性结构,各个结构的定义如下。1、输入层:我们把神经网络中的第一层称之为输入层,这一层的主要功能是将输入信号传递到神经网络当中,我们可以发现这一层本身不会对输入数据有任何运算,而是输入数据在从输入层传递到隐含层的过程中,与权重及阈值的计算中,发生了输入数据的传递与更新。在图像处理的学习中,我们发现图像数据通常作为卷积神经网络的输入,而图像通常分为灰色图像和彩色图像。我们在把图像数据输入到卷积神经网络时,是把图像数据分解成像素矩阵,即我们用矩阵形式的像素值来表示对应的图像数据。在卷积神经网络中,为了展现每一层神经元的维度信息,通常将每一层卷积层的节点组成一个三维矩阵。与此同时,像素矩阵也是以三维矩阵的形式参与网络数据的传递和更新,保证了数据运算的一致性。在三维矩阵中,长和宽可以直接理解为图像的大小,而深度则理解为图像的色彩通道。比如黑白图像的深度为1,RBG彩色图像的深度为3,可以理解为颜色的三原色可以组成任意色彩,三种原色即需要三个通道。输入层要传递的图像数据实际上就是三维像素矩阵。2、卷积层:卷积层是卷积神经网络最重要的组成部分,卷积层的核心元素是卷积核,卷积核常用的大小一般为3×3或者5×5。神经网络利用卷积核将上一层的特征映射到下一层中,从而得到抽象程度更高的特征。一般来说,通过卷积层处理过的节点矩阵会变得更深,所以在上图中,可以看到经过卷积层之后的节点矩阵的深度会增加。3、池化层:池化层也是神经网络重要的组成部分,但是它不想卷积层那样,改变三维矩阵的深度,但是可以缩小矩阵的大校池化操作可以视作将一张高分辨率图像转化为低分辨率图像,整个神

【参考文献】:
期刊论文
[1]基于知识蒸馏方法的行人属性识别研究[J]. 凌弘毅.  计算机应用与软件. 2018(10)
[2]基于增强监督知识蒸馏的交通标识分类[J]. 赵胜伟,葛仕明,叶奇挺,罗朝,李强.  中国科技论文. 2017(20)

硕士论文
[1]基于Tensorflow的Android端本地图像分类的应用设计与实现[D]. 庄宁.浙江工业大学 2019
[2]复杂背景下多车牌识别算法的研究与软件系统实[D]. 梁大宽.太原理工大学 2016



本文编号:3324234

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3324234.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户194af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com