局部线性嵌入算法的改进与研究
发布时间:2017-09-16 19:01
本文关键词:局部线性嵌入算法的改进与研究
【摘要】:自本世纪初以来,流形学习作为一种有效的数据降维方法越来越受到学者们的重视。局部线性嵌入算法(LLE)作为引领流形学习快速发展的降维方式之一,它能有效的解决数据“维数灾难”问题,但是仍然不能很好的处理稀疏、非均匀数据集,为了更大程度的提升LLE算法处理数据的能力、提高降维效果,我们提出了基于局部线性嵌入算法的改进方法,主要研究点如下:首先,提出了基于高斯核函数的局部邻域优化方法,传统局部邻域选择方式存在邻域选取过大或过小的问题,我们引入高斯核函数,通过在核空间内结合样本的类别信息来改进样本距离度量方式,以相似性度量函数来实现局部邻域选择方法的改进。其次,提出了基于样本密度信息的权重向量的改进,重构权重向量的选取对算法结果影响非常大,但是传统的局部线性嵌入算法在计算重构权重向量的时候并没有考虑到样本密度和流形弯曲度这两个因素的影响,我们结合样本密度信息和流形弯曲度信息对权重向量的选取方案作进一步改进,使算法对样本的密度具有较强的鲁棒性。最后,我们提出了对算法两个主要问题的联合优化,传统局部线性嵌入算法通过保持权重向量不变,把高维空间数据嵌入到低维空间,以此来保证数据的近邻特性,这样权重向量就简单的由高维源数据空间决定,然而考虑到权重向量可以由高维源数据空间和低维目标数据空间共同决定,该方法仍有较大的改进空间,所以我们对算法流程进行了改进并且通过实验证明了改进方法的有效性。
【关键词】:流形学习 局部线性嵌入 降维 局部邻域
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181;TP311.13
【目录】:
- 摘要4-5
- Abstract5-8
- 第一章 绪论8-16
- 1.1 本章概述8
- 1.2 研究背景介绍8-10
- 1.3 国内外研究现状10-13
- 1.4 本文主要工作及创新点13-14
- 1.5 全文的组织结构14-16
- 第二章 相关背景知识介绍16-26
- 2.1 本章概述16
- 2.2 全局方法16-20
- 2.2.1 主成分分析算法(PCA)16-17
- 2.2.2 线性鉴别分析算法(LDA)17-18
- 2.2.3 多维尺度变换算法(MDS)18-19
- 2.2.4 等距离映射方法(ISOMAP)19-20
- 2.3 局部方法20-24
- 2.3.1 局部线性嵌入算法(LLE)20-21
- 2.3.2 局部稀疏线性嵌入算法(LSLE)21-22
- 2.3.3 拉普拉斯特征映射算法(LE)22-23
- 2.3.4 海塞局部线性嵌入算法(HLLE)23-24
- 2.3.5 局部切空间算法(LTSA)24
- 2.4 本章小结24-26
- 第三章 基于高斯核函数的局部邻域优化26-35
- 3.1 本章概述26
- 3.2 传统的局部邻域选择26-27
- 3.2.1 LLE局部邻域选择26
- 3.2.2 LSLE局部邻域选择26-27
- 3.3 基于高斯核函数的距离度量方法改进27-29
- 3.3.1 有监督距离度量方法27-28
- 3.3.2 有监督高斯核函数的距离度量28-29
- 3.4 局部邻域选择的优化29-31
- 3.4.1 构造相似性度量函数29-30
- 3.4.2 局部邻域选择30-31
- 3.5 本章实验31-34
- 3.5.1 AR人脸数据库介绍31
- 3.5.2 AR数据库上实验与分析31-32
- 3.5.3 ORL人脸数据库介绍32-33
- 3.5.4 ORL数据库实验与分析33-34
- 3.6 本章小结34-35
- 第四章 基于样本密度信息的权重向量改进35-44
- 4.1 本章概述35
- 4.2 局部邻域大小对算法效果的影响分析35-36
- 4.3 局部邻域样本密度分析36-37
- 4.3.1 样本密度信息36-37
- 4.3.2 样本密度信息度量37
- 4.4 局部邻域流形弯曲度分析37-38
- 4.4.1 流形弯曲度分析37-38
- 4.4.2 流形弯曲度度量38
- 4.5 基于样本密度和流形弯曲度的邻域选择改进38-39
- 4.6 基于样本密度信息的权重向量改进39-40
- 4.7 本章实验40-43
- 4.7.1 ORL数据库实验与分析40-41
- 4.7.2 Swiss roll数据集降维实验分析41-43
- 4.8 本章小结43-44
- 第五章 两个优化问题的改进44-55
- 5.1 本章概述44
- 5.2 传统LLE算法流程分析44-45
- 5.3 两个优化问题的分析45-47
- 5.3.1 高维空间优化问题分析45-46
- 5.3.2 低维空间优化问题分析46-47
- 5.4 重构误差函数的优化47
- 5.5 优化的算法流程47-48
- 5.6 我们的改进方法48-50
- 5.6.1 算法整体改进思路48
- 5.6.2 算法步骤及其数学描述48-50
- 5.7 本章实验50-53
- 5.7.1 S曲面数据集降维仿真实验50-51
- 5.7.2 Swiss roll曲面数据集降维仿真实验51-52
- 5.7.3 AR人脸数据库降维嵌入仿真实验52-53
- 5.8 本章小结53-55
- 第六章 人脸识别对比实验分析55-61
- 6.1 本章概述55
- 6.2 AR数据库实验55-58
- 6.2.1 AR人脸数据库实验一55-56
- 6.2.2 AR人脸数据库实验二56-58
- 6.3 ORL数据库实验58-60
- 6.3.1 ORL人脸数据库实验一58-59
- 6.3.2 ORL人脸数据库实验二59-60
- 6.4 本章小结60-61
- 第七章 总结与展望61-66
- 7.1 工作总结61-64
- 7.2 研究展望64-66
- 参考文献66-70
- 附录1 攻读硕士学位期间撰写的论文70-71
- 致谢71
【参考文献】
中国期刊全文数据库 前10条
1 邬伟三;;高维数据中几种常用的统计分类方法[J];白城师范学院学报;2015年11期
2 陈宇;刘培玉;孟凡龙;;基于加权直觉模糊集合的核聚类方法研究[J];山东师范大学学报(自然科学版);2015年02期
3 于文勇;康晓东;葛文杰;王昊;;基于模糊核聚类的图像SVM分类辨识[J];计算机科学;2015年03期
4 胡舜耕;魏进武;;大数据及其在电信运营中的应用研究[J];电信技术;2015年01期
5 杨静林;唐林波;宋丹;赵保军;;基于自适应聚类流形学习的增量样本降维与识别[J];系统工程与电子技术;2015年01期
6 刘银龙;;“大数据”背景下的计算机信息处理技术分析[J];电子技术与软件工程;2015年01期
7 冷亦琴;张莉;杨季文;;一种基于局部稀疏线性嵌入的降维方法及其应用[J];南京大学学报(自然科学版);2013年04期
8 ;Denoising of seismic data via multi-scale ridgelet transform[J];Earthquake Science;2009年05期
9 文贵华;陆庭辉;江丽君;文军;;基于相对流形的局部线性嵌入[J];软件学报;2009年09期
10 王磊;杜文莉;祁荣宾;钱锋;;基于样本密度信息与竞争网络的聚类中心点获取算法[J];华东理工大学学报(自然科学版);2009年04期
,本文编号:864843
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/864843.html