基于深度神经网络的细粒度图像分类方法研究
发布时间:2021-04-01 14:19
细粒度图像分类一直是计算机视觉领域中一个重要的研究方向,它在工业界和学术界都有着强烈的研究需求。随着深度神经网络技术的迅猛发展以及大规模训练数据集的出现,普通的图像识别任务已经取得了巨大的成功,然而细粒度分类识别还有着很大的提升空间。细粒度分类的难点主要在于细粒度图像具有类间差异较小、类内差异较大以及图像目标物体不突出的问题,所以如何能准确地提取出图像中目标物体位置以及目标物体具有判别性的特征是解决细粒度分类任务的关键。传统的深度卷积神经网络虽然能够有效地挖掘出图像的基本轮廓、纹理等特征信息,但是都不足以区分细粒度图像。双线性卷积神经网络是一种解决弱监督细粒度分类问题的模型,但是存在参数量过多、预测精度不够高等问题。本文主要针对上述两个问题,提出了对应的改进方法。本文的主要工作如下:(1)针对双线性卷积网络参数量过多,不利于模型训练及部署的问题,本文结合分组卷积的思想,提出了一种基于特征分组的双线性卷积模型。经实验表明,该模型能够在牺牲少许精度的情况下,有效地将模型的参数量压缩到原有模型的1/3。(2)通过调研注意力机制在图像领域的应用,将双线性卷积模型结合两种不同的注意力模块,提出了...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
神经元结构
电子科技大学硕士学位论文82.1.2感知机与多层网络感知机是神经网络的一种简单结构,它由两层的神经元构成,其结构如图2-2所示。图2-2感知器结构图中输入层包含了两个神经元12x,x,主要负责接收外部的输入信号。然后将信号传输到输出层中的神经元。值得注意的是,感知器只有输出层神经元进行激活函数处理,即只拥有一层功能性的神经元,这就造成感知器模型的学习能力非常有限,一般只能解决线性求解问题。所以如果要解决非线性的问题,需要考虑使用多层神经元结构,如图2-3所示。图2-3多层网络结构每层中的神经元都与下一层的所有神经元相连接,而同一层神经元之间没有连接,也不会存在跨层连接的情况。这样的神经网络结构称为“多层前馈神经网络”。网络中的输入层神经元用于接收外界的输入信号,隐藏层神经元则对输入层的输出进行变换处理,最终由输出层神经元输出结果。所以输入层神经元仅是接收输入,不会对特征数据做非线性变换处理。而隐藏层与输出层这两层网络则是由功能性神经元组成,它们具有一定的非线性变换能力。因此,这类神经网络
电子科技大学硕士学位论文82.1.2感知机与多层网络感知机是神经网络的一种简单结构,它由两层的神经元构成,其结构如图2-2所示。图2-2感知器结构图中输入层包含了两个神经元12x,x,主要负责接收外部的输入信号。然后将信号传输到输出层中的神经元。值得注意的是,感知器只有输出层神经元进行激活函数处理,即只拥有一层功能性的神经元,这就造成感知器模型的学习能力非常有限,一般只能解决线性求解问题。所以如果要解决非线性的问题,需要考虑使用多层神经元结构,如图2-3所示。图2-3多层网络结构每层中的神经元都与下一层的所有神经元相连接,而同一层神经元之间没有连接,也不会存在跨层连接的情况。这样的神经网络结构称为“多层前馈神经网络”。网络中的输入层神经元用于接收外界的输入信号,隐藏层神经元则对输入层的输出进行变换处理,最终由输出层神经元输出结果。所以输入层神经元仅是接收输入,不会对特征数据做非线性变换处理。而隐藏层与输出层这两层网络则是由功能性神经元组成,它们具有一定的非线性变换能力。因此,这类神经网络
【参考文献】:
期刊论文
[1]A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J]. Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan. International Journal of Automation and Computing. 2017(02)
本文编号:3113481
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
神经元结构
电子科技大学硕士学位论文82.1.2感知机与多层网络感知机是神经网络的一种简单结构,它由两层的神经元构成,其结构如图2-2所示。图2-2感知器结构图中输入层包含了两个神经元12x,x,主要负责接收外部的输入信号。然后将信号传输到输出层中的神经元。值得注意的是,感知器只有输出层神经元进行激活函数处理,即只拥有一层功能性的神经元,这就造成感知器模型的学习能力非常有限,一般只能解决线性求解问题。所以如果要解决非线性的问题,需要考虑使用多层神经元结构,如图2-3所示。图2-3多层网络结构每层中的神经元都与下一层的所有神经元相连接,而同一层神经元之间没有连接,也不会存在跨层连接的情况。这样的神经网络结构称为“多层前馈神经网络”。网络中的输入层神经元用于接收外界的输入信号,隐藏层神经元则对输入层的输出进行变换处理,最终由输出层神经元输出结果。所以输入层神经元仅是接收输入,不会对特征数据做非线性变换处理。而隐藏层与输出层这两层网络则是由功能性神经元组成,它们具有一定的非线性变换能力。因此,这类神经网络
电子科技大学硕士学位论文82.1.2感知机与多层网络感知机是神经网络的一种简单结构,它由两层的神经元构成,其结构如图2-2所示。图2-2感知器结构图中输入层包含了两个神经元12x,x,主要负责接收外部的输入信号。然后将信号传输到输出层中的神经元。值得注意的是,感知器只有输出层神经元进行激活函数处理,即只拥有一层功能性的神经元,这就造成感知器模型的学习能力非常有限,一般只能解决线性求解问题。所以如果要解决非线性的问题,需要考虑使用多层神经元结构,如图2-3所示。图2-3多层网络结构每层中的神经元都与下一层的所有神经元相连接,而同一层神经元之间没有连接,也不会存在跨层连接的情况。这样的神经网络结构称为“多层前馈神经网络”。网络中的输入层神经元用于接收外界的输入信号,隐藏层神经元则对输入层的输出进行变换处理,最终由输出层神经元输出结果。所以输入层神经元仅是接收输入,不会对特征数据做非线性变换处理。而隐藏层与输出层这两层网络则是由功能性神经元组成,它们具有一定的非线性变换能力。因此,这类神经网络
【参考文献】:
期刊论文
[1]A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J]. Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan. International Journal of Automation and Computing. 2017(02)
本文编号:3113481
本文链接:https://www.wllwen.com/guanlilunwen/pinpaiwenhualunwen/3113481.html