多视图的子空间学习及在图像分类中的应用研究
发布时间:2021-03-23 19:21
在模式识别、计算机视觉和数据可视化等领域的实际应用中,同一个物体通常被表示为多个高维特征空间中的数据,即多视图数据。多视图数据往往比单视图数据包含更多的互补信息,更有利于分类,因此,近年来多视图学习技术得到了越来越多的研究者们的关注。本文主要针对多视图学习技术中的子空间学习方法进行研究,并将主要研究内容总结如下:一、提出了一种多视图局部鉴别学习方法——基于随机子空间的多视图局部鉴别投影(RSMLDP)。一方面,RSMLDP解决了直接使用原始高维数据构造近邻图易受噪声的影响从而影响分类性能的稳定性;另一方面,RSMLDP充分利用了样本的标记信息和局部信息,有效地挖掘了多视图样本的鉴别特征和内在的局部结构信息。首先,RSMLDP利用随机子空间技术,对原始数据进行随机特征选择,将多次随机特征选择后的特征子集进行融合后,在融合后的低维特征子空间中为每个视图构造近邻图;接着为每个视图学习一个鉴别的投影变换,使得在该变换空间上,每个视图的同类近邻样本相互靠近,异类近邻样本相互远离,同时样本的总体局部结构信息能够得到保持。在MNIST手写体数字图片数据库、COIL-20物体数据库、Multi-PIE...
【文章来源】:南京邮电大学江苏省
【文章页数】:130 页
【学位级别】:博士
【部分图文】:
原始空间上的样本分布示例
13图 2.2 LPP 投影后的特征分布述,在训练样本集中选取三类样本,分别用符号□、○和。图 2.1 为通过k NN标准对原始空间中的部分示例样本据流形,左图中的数据流形中的样本能很好的聚在一起,由于两类样本距离较近,使得同一数据流形中同时存在两到的特征分布情况。可以看出,左图中投影后的特征聚集于保持数据的近邻关系发生了部分重叠。LMMDE 方法通
3.3.1 数据库介绍本章采用如下四个著名数据库进行实验:MNIST 手写体数字图片数据库[157]、COIL-20 物体数据库[158]、Multi-PIE 人脸数据库[159]和 Caltech-101 大规模物体数据库[160]。下面对这四个数据库分别进行介绍:MNIST 手写体数字图片数据库是由 0~9 的数字图片组成,数据库中的图片来源于 NIST的专题数据库 3 和专题数据库 1。该数据库中,每个数字(类别)包含 100 张大小为28 28像素的数字图片。图 3.1 显示了 MNIST 数据库中 0~9 的部分示例图片。为了构建实验所需的多视图特征集,分别对原始图片提取以下三类特征:1)Gabor 变换特征[161];2)Karhunen-Loeve(KL)变换特征[162];3)Local binary patterns(LBP)[163]特征。为了使每类特征集样本的维数保持一致,这里使用 PCA 变换[17]方法将三类特征集数据的维数都降到 100 维。
【参考文献】:
期刊论文
[1]一种多流形正则化的多视图非负矩阵分解算法[J]. 宗林林,张宪超,赵乾利,于红,刘馨月. 南京大学学报(自然科学). 2017(03)
[2]基于弱匹配概率典型相关性分析的图像自动标注[J]. 张博,郝杰,马刚,史忠植. 软件学报. 2017(02)
[3]改进的协同训练框架下压缩跟踪[J]. 郑超,陈杰,殷松峰,杨星,冯云松,凌永顺. 电子与信息学报. 2016(07)
本文编号:3096295
【文章来源】:南京邮电大学江苏省
【文章页数】:130 页
【学位级别】:博士
【部分图文】:
原始空间上的样本分布示例
13图 2.2 LPP 投影后的特征分布述,在训练样本集中选取三类样本,分别用符号□、○和。图 2.1 为通过k NN标准对原始空间中的部分示例样本据流形,左图中的数据流形中的样本能很好的聚在一起,由于两类样本距离较近,使得同一数据流形中同时存在两到的特征分布情况。可以看出,左图中投影后的特征聚集于保持数据的近邻关系发生了部分重叠。LMMDE 方法通
3.3.1 数据库介绍本章采用如下四个著名数据库进行实验:MNIST 手写体数字图片数据库[157]、COIL-20 物体数据库[158]、Multi-PIE 人脸数据库[159]和 Caltech-101 大规模物体数据库[160]。下面对这四个数据库分别进行介绍:MNIST 手写体数字图片数据库是由 0~9 的数字图片组成,数据库中的图片来源于 NIST的专题数据库 3 和专题数据库 1。该数据库中,每个数字(类别)包含 100 张大小为28 28像素的数字图片。图 3.1 显示了 MNIST 数据库中 0~9 的部分示例图片。为了构建实验所需的多视图特征集,分别对原始图片提取以下三类特征:1)Gabor 变换特征[161];2)Karhunen-Loeve(KL)变换特征[162];3)Local binary patterns(LBP)[163]特征。为了使每类特征集样本的维数保持一致,这里使用 PCA 变换[17]方法将三类特征集数据的维数都降到 100 维。
【参考文献】:
期刊论文
[1]一种多流形正则化的多视图非负矩阵分解算法[J]. 宗林林,张宪超,赵乾利,于红,刘馨月. 南京大学学报(自然科学). 2017(03)
[2]基于弱匹配概率典型相关性分析的图像自动标注[J]. 张博,郝杰,马刚,史忠植. 软件学报. 2017(02)
[3]改进的协同训练框架下压缩跟踪[J]. 郑超,陈杰,殷松峰,杨星,冯云松,凌永顺. 电子与信息学报. 2016(07)
本文编号:3096295
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3096295.html