多层Laplacian稀疏编码的图像分类算法研究
发布时间:2021-06-05 10:45
图像分类主要根据图像的特征属性对图像进行自动分类.受光照、尺度变化等因素的影响,如何提取图像特征并对图像进行有效表示成为图像分类的主要研究问题.稀疏编码是一种高效的特征表示方法,它通过寻找一组超完备字典基向量,求得特征基于字典基的重建系数,在图像分类上取得了较好的性能.然而,稀疏编码的研究仍存在不足之处,比如忽略了字典基之间的群效应,欧氏距离不能很好地度量特征向量与字典基之间的距离,以及Laplacian正则项忽略了特征的空间拓扑结构信息,导致特征的泛化能力较弱等.此外,与基于深度学习的方法相比,单层模型的特征学习能力具有一定的局限性,它难以发现数据的深层特征.本文主要围绕稀疏编码和深度学习进行研究,分别对上述问题提出相应的解决方法,并对标准数据集进行了一系列综合实验.本文的主要研究工作和创新点如下:1.针对1l范数只考虑编码的稀疏性而忽略群效应问题,提出基于弹性网和直方图相交的稀疏编码方法.在编码的优化函数中引入2l范数作为正则项,能够获得类似1l范数的稀疏性,且考虑群效应.并且通过引入直方图相交,重新定义特征向量与字...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
VQ、SC和LLC的编码示意图[20]
10由于同时优化目标函数中的U和S,该问题是非凸的,这样很难找到一个全局最小值,但交替优化U或S该问题是凸的,就会存在全局最优解.图2-2Laplacian矩阵的结构示意图[48]2.3深度学习及相关模型深度学习在计算机视觉领域所表现的优越性使得深度学习方法近年来成为了图像处理及分类方法的热点研究方法,通过深度神经网络直接从数据中学习特征对于视觉识别变得越来越流行.本节首先对深度学习进行简单地介绍,然后对具有代表意义的一种经典深度学习模型进行详细地介绍.2.3.1浅层学习到深度学习机器学习的发展历程由浅层至深度[49].浅层学习模型基本上含有一个隐藏节点或没有隐藏节点,采用反向传播算法的人工神经网络是最具代表性的一种浅层学习模型.90年代末,各类浅层模型相继被提出,如最大熵方法、支持向量机(SupportVectorMachine,SVM)等浅层监督学习模型,K-means、主成分分析等浅层无监督学习模型.浅层学习模型虽然能够较好的处理一些简单问题,具有原理简单,使用方便的优点,但浅层模型对复杂函数的表示能力有限[50],因此具有较弱的泛化能力.另外,浅层结构缺乏发现数据中复杂结构的能力,很容易出现欠拟合现象.相对于浅层学习模型,深度模型通过大量数据和多个隐含层来学习更有用和更高级的特征.因此,深度模型在特征学习方面具有较强的表达能力.与传统的浅层学习模型不同,深度学习不仅强调了多隐层的深度结构,更重要的是突出了特征学习能力的强大性.深度模型通过逐层的特征提取,将原始数据的
11特征变换到一个新的特征空间,从而更容易实现分类或预测问题.特征学习是深度学习模型的核心问题,与复杂的人工特征提取方法比较,深度学习模型能够有效刻画数据的丰富内在结构信息.深度模型旨在学习不同的特征层次结构,同层可以保持数据之间的空间平滑度,下层在上层的基础上可以捕获数据更多的空间信息,使得特征表示具有更强的鲁棒性.深度学习包含卷积神经网络、自编码器、受限玻尔兹曼机、深度置信网络(DeepBeliefNetworks,DBN)[51]等算法.2.3.2卷积神经网络(CNN)对于不同的对象如图像、文本、语音等,需要不同的网络模型来获得更好的结果.卷积神经网络作为一种深度前馈神经网络,已在图像识别领域成功地应用.CNN本质上是一个含有多个神经元层的感知机,它所采用的权值共享和局部连接的方式是其成功的关键.一方面减少了网络模型参数的数量,降低了网络结构的复杂度,使得网络更加易于优化;另一方面过拟合的风险也大大降低.另外,图像直接作为网络的输入也是卷积神经网络的一大优点,不需要对数据进行预处理或特征提取.卷积层和池化层共同构成CNN的特征提取器,降低了图像识别问题中巨大数据量的维数.LeCun最先将卷积神经网络成功地应用于手写字符识别中,并提出LeNet-5网络模型.LeNet-5是最经典的卷积神经网络之一,网络结构相对比较简单.其网络结构如图2-3所示.图2-3LeNet-5网络模型框架[40]LeNet-5网络由输入层、卷积层(C1,C3)、池化层(S2,S4)、全连接层和输出层组成.C1卷积层对输入图像进行特征提取,S2池化层可以防止模型出现过拟合并降低网络训练参数,最大值和平均值是常用的两种池化操作.C3卷积层用
【参考文献】:
期刊论文
[1]Two-stage local constrained sparse coding for fine-grained visual categorization[J]. Lihua GUO,Chenggang GUO,Lei LI,Qinghua HUANG,Yanshan LI,Xuelong LI. Science China(Information Sciences). 2018(01)
[2]基于多尺度特征融合Hessian稀疏编码的图像分类算法[J]. 刘盛清,孙季丰,余家林,宋治国. 计算机应用. 2017(12)
[3]基于非负弹性网稀疏编码算法的图像分类方法[J]. 张勇,张阳阳,程洪,张艳霞. 计算机工程. 2017(07)
[4]非负局部约束线性编码图像分类算法[J]. 刘培娜,刘国军,郭茂祖,刘扬,李盼. 自动化学报. 2015(07)
博士论文
[1]基于半监督学习的木材识别研究[D]. 卢纪丽.山东大学 2015
硕士论文
[1]基于稀疏深度学习的图像分类研究[D]. 张春磊.华北理工大学 2017
[2]基于深度学习模型的图像分类研究[D]. 祝军.宁波大学 2015
[3]融入直方图相交核的局部稀疏编码图像分类算法研究[D]. 李盼.哈尔滨工业大学 2014
[4]基于稀疏编码的半监督图像分类研究[D]. 陈汉英.中国科学技术大学 2014
[5]采用稀疏表示的大规模图像检索技术研究[D]. 李修志.苏州大学 2012
本文编号:3212016
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
VQ、SC和LLC的编码示意图[20]
10由于同时优化目标函数中的U和S,该问题是非凸的,这样很难找到一个全局最小值,但交替优化U或S该问题是凸的,就会存在全局最优解.图2-2Laplacian矩阵的结构示意图[48]2.3深度学习及相关模型深度学习在计算机视觉领域所表现的优越性使得深度学习方法近年来成为了图像处理及分类方法的热点研究方法,通过深度神经网络直接从数据中学习特征对于视觉识别变得越来越流行.本节首先对深度学习进行简单地介绍,然后对具有代表意义的一种经典深度学习模型进行详细地介绍.2.3.1浅层学习到深度学习机器学习的发展历程由浅层至深度[49].浅层学习模型基本上含有一个隐藏节点或没有隐藏节点,采用反向传播算法的人工神经网络是最具代表性的一种浅层学习模型.90年代末,各类浅层模型相继被提出,如最大熵方法、支持向量机(SupportVectorMachine,SVM)等浅层监督学习模型,K-means、主成分分析等浅层无监督学习模型.浅层学习模型虽然能够较好的处理一些简单问题,具有原理简单,使用方便的优点,但浅层模型对复杂函数的表示能力有限[50],因此具有较弱的泛化能力.另外,浅层结构缺乏发现数据中复杂结构的能力,很容易出现欠拟合现象.相对于浅层学习模型,深度模型通过大量数据和多个隐含层来学习更有用和更高级的特征.因此,深度模型在特征学习方面具有较强的表达能力.与传统的浅层学习模型不同,深度学习不仅强调了多隐层的深度结构,更重要的是突出了特征学习能力的强大性.深度模型通过逐层的特征提取,将原始数据的
11特征变换到一个新的特征空间,从而更容易实现分类或预测问题.特征学习是深度学习模型的核心问题,与复杂的人工特征提取方法比较,深度学习模型能够有效刻画数据的丰富内在结构信息.深度模型旨在学习不同的特征层次结构,同层可以保持数据之间的空间平滑度,下层在上层的基础上可以捕获数据更多的空间信息,使得特征表示具有更强的鲁棒性.深度学习包含卷积神经网络、自编码器、受限玻尔兹曼机、深度置信网络(DeepBeliefNetworks,DBN)[51]等算法.2.3.2卷积神经网络(CNN)对于不同的对象如图像、文本、语音等,需要不同的网络模型来获得更好的结果.卷积神经网络作为一种深度前馈神经网络,已在图像识别领域成功地应用.CNN本质上是一个含有多个神经元层的感知机,它所采用的权值共享和局部连接的方式是其成功的关键.一方面减少了网络模型参数的数量,降低了网络结构的复杂度,使得网络更加易于优化;另一方面过拟合的风险也大大降低.另外,图像直接作为网络的输入也是卷积神经网络的一大优点,不需要对数据进行预处理或特征提取.卷积层和池化层共同构成CNN的特征提取器,降低了图像识别问题中巨大数据量的维数.LeCun最先将卷积神经网络成功地应用于手写字符识别中,并提出LeNet-5网络模型.LeNet-5是最经典的卷积神经网络之一,网络结构相对比较简单.其网络结构如图2-3所示.图2-3LeNet-5网络模型框架[40]LeNet-5网络由输入层、卷积层(C1,C3)、池化层(S2,S4)、全连接层和输出层组成.C1卷积层对输入图像进行特征提取,S2池化层可以防止模型出现过拟合并降低网络训练参数,最大值和平均值是常用的两种池化操作.C3卷积层用
【参考文献】:
期刊论文
[1]Two-stage local constrained sparse coding for fine-grained visual categorization[J]. Lihua GUO,Chenggang GUO,Lei LI,Qinghua HUANG,Yanshan LI,Xuelong LI. Science China(Information Sciences). 2018(01)
[2]基于多尺度特征融合Hessian稀疏编码的图像分类算法[J]. 刘盛清,孙季丰,余家林,宋治国. 计算机应用. 2017(12)
[3]基于非负弹性网稀疏编码算法的图像分类方法[J]. 张勇,张阳阳,程洪,张艳霞. 计算机工程. 2017(07)
[4]非负局部约束线性编码图像分类算法[J]. 刘培娜,刘国军,郭茂祖,刘扬,李盼. 自动化学报. 2015(07)
博士论文
[1]基于半监督学习的木材识别研究[D]. 卢纪丽.山东大学 2015
硕士论文
[1]基于稀疏深度学习的图像分类研究[D]. 张春磊.华北理工大学 2017
[2]基于深度学习模型的图像分类研究[D]. 祝军.宁波大学 2015
[3]融入直方图相交核的局部稀疏编码图像分类算法研究[D]. 李盼.哈尔滨工业大学 2014
[4]基于稀疏编码的半监督图像分类研究[D]. 陈汉英.中国科学技术大学 2014
[5]采用稀疏表示的大规模图像检索技术研究[D]. 李修志.苏州大学 2012
本文编号:3212016
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3212016.html
最近更新
教材专著