基于流形学习的单细胞降维算法研究
发布时间:2024-11-30 21:46
单细胞RNA测序在发现细胞类型、识别细胞状态、追踪发育谱系、重建细胞空间组织等方面有着巨大的潜力。随着单细胞测序技术的发展,测序的结果越来越细致,单次可测量的细胞越来越多,这些单细胞中蕴含了丰富的信息,在分析和处理这些数据的过程中,有效降维就显得更为重要。本文研究了当前流行的单细胞数据降维算法t-SNE,并把线性降维算法PCA和两种经典的基于流形学习的降维算法LLE和MDS应用到单细胞数据降维处理的过程中。并通过对四种算法的分析研究,提出一种结合降维方法。先用PCA对原始数据进行降维,然后再分别用LLE,MDS和t-SNE进行二次降维。本文首先从GEO数据库中选取数据,然后对数据进行筛选和预处理,接下来使用Linnorm归一化方法,统一数据标准,然后对数据集进行降维聚类处理,并计算ARI值。最后通过算法运行时长和ARI值,比较四种算法的优劣并进行分析。本文选取了GEO数据库中的一个公开数据集作为实证分析的处理数据集,此数据集包含六个样本。本文首先使用四种降维算法对这六个样本进行降维,通过算法运行时长和ARI值比较这四种降维算法的优劣。然后针对这几种算法存在的问题,通过算法结合的方式,对降...
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题来源
1.2 课题研究背景
1.3 国内外研究现状及分析
1.4 主要研究内容
第2章 降维算法简介
2.1 流形学习
2.2 主成分分析
2.3 t分布随机邻居嵌入
2.4 多维缩放
2.5 局部线性嵌入
2.6 本章小结
第3章 数据处理流程
3.1 数据归一化
3.2 数据降维
3.3 聚类
3.4 可视化分析及算法比较
3.5 本章小结
第4章 实证分析
4.1 数据集来源
4.2 四种降维算法性能比较
4.3 结合降维
4.3.1 PCA和 LLE的结合降维
4.3.2 PCA和 MDS的结合降维
4.3.3 PCA和 t-SNE的结合降维
4.3.4 总结
4.4 结合后的降维算法性能比较
4.5 本章小结
结论
参考文献
致谢
本文编号:4013059
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题来源
1.2 课题研究背景
1.3 国内外研究现状及分析
1.4 主要研究内容
第2章 降维算法简介
2.1 流形学习
2.2 主成分分析
2.3 t分布随机邻居嵌入
2.4 多维缩放
2.5 局部线性嵌入
2.6 本章小结
第3章 数据处理流程
3.1 数据归一化
3.2 数据降维
3.3 聚类
3.4 可视化分析及算法比较
3.5 本章小结
第4章 实证分析
4.1 数据集来源
4.2 四种降维算法性能比较
4.3 结合降维
4.3.1 PCA和 LLE的结合降维
4.3.2 PCA和 MDS的结合降维
4.3.3 PCA和 t-SNE的结合降维
4.3.4 总结
4.4 结合后的降维算法性能比较
4.5 本章小结
结论
参考文献
致谢
本文编号:4013059
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4013059.html