基于联合稀疏投影的图像特征提取
发布时间:2022-01-24 23:37
维数约简(即降维)是机器学习的基本任务之一。降维旨在从高维原始样本空间中提取或选择关键的低维特征,从而解决高维特征导致的维数灾难问题。以主成分分析(PCA)和线性鉴别分析(LDA)为代表的传统特征提取方法,由于是基于数据全局结构来提取低维特征,当高维数据的分布有着明显的局部性或有近似流形结构时,传统特征提取方法的效果往往不佳。而基于流形学习的特征提取方法却能够保持高维空间的局部几何结构,有可能获得更好的分类性能,但仍存在不足。通过分析比较这些方法的优缺点,本文总结出它们存在的三个问题。第一,以LDA为代表的一些方法会存在小类别问题,即在数据样本类别数较小时,学到的投影个数会受到限制。第二,这些方法有的开始将稀疏约束引入到流形学习,即通过正则项来约束学到的投影,使之具备稀疏的特性,但其中很多方法是以1L范数正则项来获取稀疏性,而不具一致稀疏性。第三,大部分方法使用2L范数来度量损失,导致算法对数据野点较为敏感,而真实数据常常存在噪声,因此需要更多地考虑如何提升算法的鲁棒性。针对上述总结的三个问题,基于流形学习和联合稀疏学习理论和方法,本文提出了...
【文章来源】:深圳大学广东省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
机器学习算法流程图
基于联合稀疏投影的图像特征提取712211mdijFijPP===∑∑。(2.2)我们在此重点分析2,1L范数能够具备联合稀疏特性的原因。先给出2,1L的定义,假定一个投影矩阵[]12=,,...,mdidPppppR×,...,∈投影向量m1ipR×∈为m维列向量,则22,11112dmdiijijiPPp====∑=∑∑。(2.3)其中ip是矩阵P的第i个行向量。由2,1L范数定义可知,2,1L范数是一个介于F范数和1L范数之间的范数定义。2,1L范数如果用于正则化投影矩阵,就能够约束每一个行向量的2L范数最小,能够直接希望获得行内尽可能取零的联合稀疏性效果,以及和2L范数正则项中加强模型鲁棒性的双重优点。我们定义投影矩阵×P∈Rmd,投影矩阵P的基向量为m维行向量。我们假定投影矩阵具有联合稀疏性即列稀疏,矩阵中某些列向量全为零,样本矩阵为×X∈Rmn,一个样本为一个列向量,新的特征矩阵用×Z∈Rdn来定义,线性特征提取的公式就相当于如下式=TZPX。(2.4)如图2.1所示,假设投影矩阵P中第1、3、6列出现全为零的列稀疏(联合稀疏)特性,通过线性投影操作之后将得到新的特征矩阵Z,原始样本矩阵X中用不同颜色的第1、3、6行表示不同的特征,会发现在新的特征矩阵Z中本来对应不同颜色的特征被筛选掉。图2.1联合稀疏特性直观图
基于联合稀疏投影的图像特征提取283.4实验验证在本章,我们将新提出的JSLPP方法在三个公开的图像图像库上对其算法有效性进行实验验证,我们采取的图像库分别是AR和ORL人脸图像库、COIL100物体检测图像图像库[50]。我们分别在人脸和物体两种类型的图像图像库来测验算法的性能。同时与已提出的一些相关的线性特征提取算法进行对比,包括一些传统的特征提取方法和基于流形学习的线性特征提取方法等。3.4.1实验设置和说明在实验中,我们首先给出我们的实验流程如图3.1,我们按留出法把图像图像库划图3.1实验流程图分训练集和测试集,具体划分方式为:设置同一个类别中用于训练的样本个数分别为4、5、6,其余的样本为测试集。单次实验流程为模型的训练和测试,具体的步骤可以参看如图3.1,训练模型过程的目标是在训练集上训练得到一个最优的投影矩阵P,然后选取投影矩阵P将测试样本线性投影提取低维特征,低维特征的维数依次从5维到d维,最后使用KNN分类器对提取的特征进行分类,并计算识别率。我们设定实验次数为10次,每次训练都要随机生成训练集和测试集,以此保证每次的训练样本是不同的,进而每次训练都得到不同的投影矩阵P,最后统计10次实验的分类正确率的平均值r,10
【参考文献】:
期刊论文
[1]国务院印发《新一代人工智能发展规划》:构筑我国人工智能发展先发优势[J]. 刘辰. 中国科技产业. 2017(08)
[2]用于数据挖掘的聚类算法[J]. 姜园,张朝阳,仇佩亮,周东方. 电子与信息学报. 2005(04)
本文编号:3607500
【文章来源】:深圳大学广东省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
机器学习算法流程图
基于联合稀疏投影的图像特征提取712211mdijFijPP===∑∑。(2.2)我们在此重点分析2,1L范数能够具备联合稀疏特性的原因。先给出2,1L的定义,假定一个投影矩阵[]12=,,...,mdidPppppR×,...,∈投影向量m1ipR×∈为m维列向量,则22,11112dmdiijijiPPp====∑=∑∑。(2.3)其中ip是矩阵P的第i个行向量。由2,1L范数定义可知,2,1L范数是一个介于F范数和1L范数之间的范数定义。2,1L范数如果用于正则化投影矩阵,就能够约束每一个行向量的2L范数最小,能够直接希望获得行内尽可能取零的联合稀疏性效果,以及和2L范数正则项中加强模型鲁棒性的双重优点。我们定义投影矩阵×P∈Rmd,投影矩阵P的基向量为m维行向量。我们假定投影矩阵具有联合稀疏性即列稀疏,矩阵中某些列向量全为零,样本矩阵为×X∈Rmn,一个样本为一个列向量,新的特征矩阵用×Z∈Rdn来定义,线性特征提取的公式就相当于如下式=TZPX。(2.4)如图2.1所示,假设投影矩阵P中第1、3、6列出现全为零的列稀疏(联合稀疏)特性,通过线性投影操作之后将得到新的特征矩阵Z,原始样本矩阵X中用不同颜色的第1、3、6行表示不同的特征,会发现在新的特征矩阵Z中本来对应不同颜色的特征被筛选掉。图2.1联合稀疏特性直观图
基于联合稀疏投影的图像特征提取283.4实验验证在本章,我们将新提出的JSLPP方法在三个公开的图像图像库上对其算法有效性进行实验验证,我们采取的图像库分别是AR和ORL人脸图像库、COIL100物体检测图像图像库[50]。我们分别在人脸和物体两种类型的图像图像库来测验算法的性能。同时与已提出的一些相关的线性特征提取算法进行对比,包括一些传统的特征提取方法和基于流形学习的线性特征提取方法等。3.4.1实验设置和说明在实验中,我们首先给出我们的实验流程如图3.1,我们按留出法把图像图像库划图3.1实验流程图分训练集和测试集,具体划分方式为:设置同一个类别中用于训练的样本个数分别为4、5、6,其余的样本为测试集。单次实验流程为模型的训练和测试,具体的步骤可以参看如图3.1,训练模型过程的目标是在训练集上训练得到一个最优的投影矩阵P,然后选取投影矩阵P将测试样本线性投影提取低维特征,低维特征的维数依次从5维到d维,最后使用KNN分类器对提取的特征进行分类,并计算识别率。我们设定实验次数为10次,每次训练都要随机生成训练集和测试集,以此保证每次的训练样本是不同的,进而每次训练都得到不同的投影矩阵P,最后统计10次实验的分类正确率的平均值r,10
【参考文献】:
期刊论文
[1]国务院印发《新一代人工智能发展规划》:构筑我国人工智能发展先发优势[J]. 刘辰. 中国科技产业. 2017(08)
[2]用于数据挖掘的聚类算法[J]. 姜园,张朝阳,仇佩亮,周东方. 电子与信息学报. 2005(04)
本文编号:3607500
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3607500.html
最近更新
教材专著