面向缺损数据的流形学习方法研究
本文关键词: 缺损数据 流形学习 余弦相似度 核范数 正则化 出处:《华侨大学》2017年硕士论文 论文类型:学位论文
【摘要】:在很多实际应用问题中,高维数据集可能具有缺失数据值。如在视频监控中,监控目标可能被其他物体部分遮挡,此时只能获取监控目标的部分图像,这些被遮挡的图像即为缺损数据,如何挖掘缺损数据的本质特征尤其是非线性特征逐渐成为机器学习和数据挖掘的一个热点。流形学习作为一种非线性的降维技术,能够较好地挖掘高维数据的非线性特征。但是,传统的流形学习算法大多基于一种近似理想的情况下,即样本数据均匀采样于一个高维欧式空间中的低维流形。当数据缺损时,流形学习的效果会受到很大的影响。因此,本文主要围绕现有流形学习算法无法较好地挖掘缺损数据集的非线性特征问题展开,从构造缺损数据集的局部邻域和局部几何结构出发,提出可以较好地挖掘缺损数据集的流形学习算法。本文主要有以下两个方面的工作:1.针对缺失像素的图像集,我们提出了一种面向缺失像素图像集的修正拉普拉斯特征映射算法。该算法将缺失像素图像集看成向量集,首先利用图像向量之间的余弦相似度衡量缺失像素图像之间的距离,构造样本点的近邻域。然后提出一种新的权值构造函数,构造权值矩阵。最后,通过极小化价值函数计算样本点的低维嵌入坐标。在多组真实图像集上的分类实验结果表明,修正的拉普拉斯特征映射算法可以很好地挖掘缺失像素图像集的内在流形结构,减弱缺失像素带来的不良影响。2.我们提出了一种基于核范数正则化的局部切空间排列算法(Local Tangent Space Alignment via Nuclear Norm Regularization,简称LTSA-NNR)。该算法首先使用余弦相似性的度量方法构造缺损数据的局部邻域,然后提出了一种核范数正则化模型用于提取邻域的局部坐标,区别于传统的流形学习算法,LTSA-NNR算法提取的局部坐标的维度位于一个合理的范围内。最后,将这些局部坐标进行排列,构造缺损数据的全局坐标。我们在一些真实数据集上进行了多个可视化实验和分类实验,用以证明LTSA-NNR算法的有效性。
[Abstract]:In many practical applications, high-dimensional data sets may have missing data values. For example, in video surveillance, the target may be partially occluded by other objects, and only part of the image of the target can be obtained. These occluded images are called defective data. How to mine the essential features of defective data, especially nonlinear features, has gradually become a hot topic in machine learning and data mining. Manifold learning is a nonlinear dimensionality reduction technique. However, most of the traditional manifold learning algorithms are based on an approximate ideal case in which the sample data are uniformly sampled in a low-dimensional manifold in a high-dimensional Euclidean space. The effect of manifold learning will be greatly affected. Therefore, this paper focuses on the problem that the existing manifold learning algorithms can not well mine the nonlinear characteristics of the defective data sets. Based on the construction of the local neighborhood and local geometry structure of the defective dataset, a manifold learning algorithm is proposed, which can be used to mine the defective dataset. In this paper, there are two main works: 1. For the image set with missing pixels, We propose a modified Laplacian feature mapping algorithm for missing pixel image sets, which regards the missing pixel image set as a vector set. Firstly, the distance between the missing pixel images is measured by the cosine similarity between the image vectors. A new weight constructor is proposed to construct the weight matrix. Finally, the minimum value function is used to calculate the low dimensional embedded coordinates of the sample points. The modified Laplace feature mapping algorithm can well mine the intrinsic manifold structure of the missing pixel image set. 2. We propose a local Tangent Space Alignment via Nuclear Norm regularization (LTSA-NNRN) algorithm based on kernel norm regularization. The local neighborhood of the damaged data, Then a kernel norm regularization model is proposed to extract the local coordinates of the neighborhood, which is different from the dimension of the local coordinates extracted by the traditional manifold learning algorithm (LTSA-NNR). These local coordinates are arranged to construct the global coordinates of the defective data. We have carried out several visualization experiments and classification experiments on some real data sets to prove the validity of the LTSA-NNR algorithm.
【学位授予单位】:华侨大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP181
【相似文献】
相关期刊论文 前10条
1 曾宪华;罗四维;;动态增殖流形学习算法[J];计算机研究与发展;2007年09期
2 曾宪华;罗四维;;局部保持的流形学习算法对比研究[J];计算机工程与应用;2008年29期
3 刘志勇;;基于保距与保拓扑的流形学习算法[J];长江大学学报(自然科学版)理工卷;2010年02期
4 闫志敏;刘希玉;;流形学习及其算法研究[J];计算机技术与发展;2011年05期
5 杨海红;;流形学习中邻域大小的选择算法[J];山西煤炭管理干部学院学报;2011年01期
6 周华;蔡超;丁明跃;;基于流形学习和流形高阶近似的图像距离度量[J];华中科技大学学报(自然科学版);2012年03期
7 石陆魁;张军;宫晓腾;;基于邻域保持的流形学习算法评价模型[J];计算机应用;2012年09期
8 谈超;关佶红;周水庚;;增量与演化流形学习综述[J];智能系统学报;2012年05期
9 徐蓉;姜峰;姚鸿勋;;流形学习概述[J];智能系统学报;2006年01期
10 罗四维;赵连伟;;基于谱图理论的流形学习算法[J];计算机研究与发展;2006年07期
相关会议论文 前4条
1 宋欣;王娟;张斌;叶世伟;;流形学习算法分析及在人脸数据库上的应用[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
2 刘晓平;季浩;邓伟财;;基于流形学习的非线性系统可视化算法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
3 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
4 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
相关博士学位论文 前10条
1 苏祖强;基于泛化流形学习的风电机组传动系统早期故障诊断方法研究[D];重庆大学;2015年
2 马婧华;基于流形学习的旋转机械早期故障融合诊断方法研究[D];重庆大学;2015年
3 邢向磊;流形学习与稀疏表示在模式识别中的应用[D];南京大学;2013年
4 卢磊;机械加工过程中的早期故障微弱信号处理方法研究[D];哈尔滨工业大学;2016年
5 郝中华;基于微分流形的非线性降维方法研究[D];上海大学;2016年
6 黄红兵;层次流形学习及其在监督分类中的应用[D];上海交通大学;2015年
7 杜春;流形学习及其应用算法研究[D];国防科学技术大学;2014年
8 李月仙;基于拉普拉斯特征映射算法的旋转机械故障诊断研究[D];太原理工大学;2016年
9 李俊;基于智能优化的特征选择及分类方法研究[D];武汉大学;2014年
10 黄鸿;图嵌入框架下流形学习理论及应用研究[D];重庆大学;2008年
相关硕士学位论文 前10条
1 胡浩松;基于流形学习的旋转机械故障识别方法研究[D];燕山大学;2015年
2 丁春涛;基于图嵌入的判别近邻分析研究及应用[D];苏州大学;2015年
3 余婵娟;交互式人脸检索中人机人脸认知一致性研究[D];上海大学;2015年
4 陈明霞;基于半监督的多流形学习算法研究[D];华侨大学;2015年
5 顾阳阳;基于流形学习的雷达辐射源识别技术[D];西安电子科技大学;2014年
6 高汉宇;基于最优r-覆盖堆积数本征维数估计方法及其应用[D];西安电子科技大学;2014年
7 罗廷金;基于流形学习的数据降维算法研究[D];国防科学技术大学;2013年
8 周韵然;基于流形学习的A股上市公司抽样的信用评价[D];电子科技大学;2014年
9 史仍浩;基于流形学习的在线社会网络节点分类[D];上海交通大学;2013年
10 陈诗文;流形学习在数据降维中的应用研究[D];浙江工业大学;2015年
,本文编号:1546924
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1546924.html