基于模糊规则的图像深度特征学习
发布时间:2021-01-25 21:57
图像特征学习是计算机视觉和机器学习领域的重要研究内容,计算机视觉中的很多任务如图像分类、目标检测、图像分割等,首先会利用图像特征学习方法抽取原始图像的特征,然后再根据具体的任务实现相应的目标。根据目前的研究,当前流行的图像特征学习方法是子空间学习和深度神经网络,这些方法无需人工参与即可自动地通过端到端的训练提取高效的特征来用于分类识别等任务。然而,子空间学习方法在核方法的选择上存在一些不足。深度神经网络图像特征抽取方法目前也面临着诸多挑战,其有效性严重依赖大规模的数据,且通常被视为黑盒模型,解释性较差。针对上述问题,本文在图像特征学习领域展开研究,如下为本文的三个主要工作:1)第一个工作是以TSK模糊系统为基础,提出了一种基于模糊规则的图像特征学习的模型,使得模型具备模糊系统强大的学习能力和较好的可解释性。不同于经典的模糊系统通常用于分类和回归任务,本文把TSK模糊系统视为一个特征抽取模型用于图像特征的抽取。本文把TSK模糊系统的前件部分视为将图像数据从原始空间映射到高维空间的一种非线性转换,模型的后件部分可以根据需求选择不同的特征学习目标准则,避免了核函数选择的同时也使得模型具有了非...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
深度学习结构图
τ玫慕峁梗?还惴旱挠τ糜谕枷翊?砹煊颉S肴??拥纳窬??缃峁共煌?珻NN通过引入局部感知野、权值共享及池化等思想,有效地减少模型参数的数量,降低了网络的复杂度。CNN主要由卷积层、池化层和全连接层这三部分组成。卷积层是CNN的核心,CNN成功的关键就是使用了卷积结构[96,97],它起到了局部感知野和权重共享的作用。在图像处理领域中经常使用卷积操作来抽取图像潜在的特征,例如传统图像处理中,Sobel算子可以提取图像的边缘特征。CNN通过训练,可以自动生成卷积核中的权重,从而逐层地提取出图像从低级到复杂的特征。图2-2展示了卷积操作的基本过程。卷积操作之后,卷积层会将计算的结果输入到非线性激活函数中,让模型从简单的线性抽取结构拓展到非线性特征抽取,极大地增强了模型的表达能力。早期的激活函数有tanh函数和sigmoid函数,近年来广泛使用的是ReLu函数及其变种形式。图2-2卷积操作示意图池化层也是CNN中的一大特色,又被称作为下采样层,是对卷积层输出的特征图进行降维压缩。一般常用的池化操作有最大值池化、平均值池化和L2范数池化,图2-3
第二章经典模糊系统及卷积神经网络概述11展示了最大值池化的流程。通过池化操作,可以压缩图像和参数,并且引入了一定平移与旋转不变性,这使得模型更具鲁棒性。图2-3最大值池化操作示意图全连接层在CNN的最后几层,在整个CNN中充当了分类器的角色。全连接层旨在把卷积层网络学习到的特征映射到样本的标记空间中,将经过卷积层提取到的二维特征图转化成一维向量。但是全连接层的参数往往占据了模型参数的绝大部分,在一些卷积神经网络中,研究者通过使用全局均值池化或是SVM来代替传统的全连接层。目前卷积神经网络的框架很多,例如早期LeCun提出了LeNet-5[98],它是第一个成功应用于数字识别问题的卷积神经网络,LeNet-5模型的整体架构如图2-4所示。LeNet-5模型一共有7层,分别由两层卷积层、两层平均池化层和三层全连接层组成。Krizhevsky等提出了AlexNet[53],通过增加网络中卷积层的数目,进一步提升模型的表征能力,采用dropout技术丢弃一些神经元防止模型过拟合的同时也提升了模型的训练速度。Szegedy等提出了GooLeNet[99],该模型的深度超过20层,使得CNN的结构进一步加深。在GooLeNet结构中采用了多个不同尺寸的卷积核来增加学习的多样性,通过采用inception结构提升了计算资源的利用率。Simonyan等人提出了VGG[100]模型,VGG将传统CNN中单个尺寸较大的卷积核替换成多个尺寸较小的卷积核,这种替换卷积核的思想使得模型可以学到更为丰富特征的同时还减少参数的数量。但是由于VGG的深度较深,网络结构比较复杂,会耗费大量的计算资源。图2-4LeNet-5整体结构虽然针对不同的视觉任务提出了许多不同的深度卷积网络变体,但此类神经网络通常被视为是一个黑盒模型,解释性比较差,这也限制了其在解释性要求较高领域的应用。
【参考文献】:
期刊论文
[1]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
[2]基于模糊子空间聚类的〇阶L2型TSK模糊系统[J]. 邓赵红,张江滨,蒋亦樟,史荧中,王士同. 电子与信息学报. 2015(09)
[3]针对大样本集的融合模糊系统[J]. 徐华,张庭,戴阳阳. 计算机应用研究. 2015(08)
[4]基于监督学习的Takagi Sugeno Kang模糊系统图像融合方法研究[J]. 李奕,吴小俊. 电子与信息学报. 2014(05)
[5]基于正负模糊规则的相结合的图像分类[J]. 吴军,王士同. 计算机应用. 2011(01)
[6]基于灰度共生矩阵的纹理特征提取[J]. 高程程,惠晓威. 计算机系统应用. 2010(06)
[7]模糊规则自适应学习的弹性图像配准[J]. 王士同,邓赵红. 江南大学学报(自然科学版). 2007(06)
[8]基于SVM的模糊推理在图像降噪中的建模与仿真[J]. 孙红星,赵楠楠,徐心和. 系统仿真学报. 2006(11)
[9]基于模糊逻辑的图像检索研究[J]. 王小玲,谢康林. 控制与决策. 2005(12)
[10]基于进化策略生成可解释性模糊系统[J]. 阎岭,郑洪涛,蒋静坪. 电子学报. 2005(01)
硕士论文
[1]基于词袋模型的图像分类系统[D]. 刘爽.大连海事大学 2015
本文编号:2999963
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
深度学习结构图
τ玫慕峁梗?还惴旱挠τ糜谕枷翊?砹煊颉S肴??拥纳窬??缃峁共煌?珻NN通过引入局部感知野、权值共享及池化等思想,有效地减少模型参数的数量,降低了网络的复杂度。CNN主要由卷积层、池化层和全连接层这三部分组成。卷积层是CNN的核心,CNN成功的关键就是使用了卷积结构[96,97],它起到了局部感知野和权重共享的作用。在图像处理领域中经常使用卷积操作来抽取图像潜在的特征,例如传统图像处理中,Sobel算子可以提取图像的边缘特征。CNN通过训练,可以自动生成卷积核中的权重,从而逐层地提取出图像从低级到复杂的特征。图2-2展示了卷积操作的基本过程。卷积操作之后,卷积层会将计算的结果输入到非线性激活函数中,让模型从简单的线性抽取结构拓展到非线性特征抽取,极大地增强了模型的表达能力。早期的激活函数有tanh函数和sigmoid函数,近年来广泛使用的是ReLu函数及其变种形式。图2-2卷积操作示意图池化层也是CNN中的一大特色,又被称作为下采样层,是对卷积层输出的特征图进行降维压缩。一般常用的池化操作有最大值池化、平均值池化和L2范数池化,图2-3
第二章经典模糊系统及卷积神经网络概述11展示了最大值池化的流程。通过池化操作,可以压缩图像和参数,并且引入了一定平移与旋转不变性,这使得模型更具鲁棒性。图2-3最大值池化操作示意图全连接层在CNN的最后几层,在整个CNN中充当了分类器的角色。全连接层旨在把卷积层网络学习到的特征映射到样本的标记空间中,将经过卷积层提取到的二维特征图转化成一维向量。但是全连接层的参数往往占据了模型参数的绝大部分,在一些卷积神经网络中,研究者通过使用全局均值池化或是SVM来代替传统的全连接层。目前卷积神经网络的框架很多,例如早期LeCun提出了LeNet-5[98],它是第一个成功应用于数字识别问题的卷积神经网络,LeNet-5模型的整体架构如图2-4所示。LeNet-5模型一共有7层,分别由两层卷积层、两层平均池化层和三层全连接层组成。Krizhevsky等提出了AlexNet[53],通过增加网络中卷积层的数目,进一步提升模型的表征能力,采用dropout技术丢弃一些神经元防止模型过拟合的同时也提升了模型的训练速度。Szegedy等提出了GooLeNet[99],该模型的深度超过20层,使得CNN的结构进一步加深。在GooLeNet结构中采用了多个不同尺寸的卷积核来增加学习的多样性,通过采用inception结构提升了计算资源的利用率。Simonyan等人提出了VGG[100]模型,VGG将传统CNN中单个尺寸较大的卷积核替换成多个尺寸较小的卷积核,这种替换卷积核的思想使得模型可以学到更为丰富特征的同时还减少参数的数量。但是由于VGG的深度较深,网络结构比较复杂,会耗费大量的计算资源。图2-4LeNet-5整体结构虽然针对不同的视觉任务提出了许多不同的深度卷积网络变体,但此类神经网络通常被视为是一个黑盒模型,解释性比较差,这也限制了其在解释性要求较高领域的应用。
【参考文献】:
期刊论文
[1]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
[2]基于模糊子空间聚类的〇阶L2型TSK模糊系统[J]. 邓赵红,张江滨,蒋亦樟,史荧中,王士同. 电子与信息学报. 2015(09)
[3]针对大样本集的融合模糊系统[J]. 徐华,张庭,戴阳阳. 计算机应用研究. 2015(08)
[4]基于监督学习的Takagi Sugeno Kang模糊系统图像融合方法研究[J]. 李奕,吴小俊. 电子与信息学报. 2014(05)
[5]基于正负模糊规则的相结合的图像分类[J]. 吴军,王士同. 计算机应用. 2011(01)
[6]基于灰度共生矩阵的纹理特征提取[J]. 高程程,惠晓威. 计算机系统应用. 2010(06)
[7]模糊规则自适应学习的弹性图像配准[J]. 王士同,邓赵红. 江南大学学报(自然科学版). 2007(06)
[8]基于SVM的模糊推理在图像降噪中的建模与仿真[J]. 孙红星,赵楠楠,徐心和. 系统仿真学报. 2006(11)
[9]基于模糊逻辑的图像检索研究[J]. 王小玲,谢康林. 控制与决策. 2005(12)
[10]基于进化策略生成可解释性模糊系统[J]. 阎岭,郑洪涛,蒋静坪. 电子学报. 2005(01)
硕士论文
[1]基于词袋模型的图像分类系统[D]. 刘爽.大连海事大学 2015
本文编号:2999963
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2999963.html