基于矩阵分解和图的单细胞无监督聚类研究
发布时间:2024-03-07 18:48
转录组测序数据蕴含丰富的生物模式,能够反映生命体在特定时间或空间下的基因表达情况,典型应用如:胚胎发育及分化过程研究、癌症等重大疾病的诊疗与筛查、药物研发和基因功能发现等。然而,利用转录组数据做细胞聚类分型是上述所有研究问题的基础,转录组数据具有高维度、小样本、无标记、高噪声的特点,给常规的数据挖掘和机器学习任务带来挑战。本文基于单细胞转录组数据,研究了三种无监督聚类模型,并分析其在转录组数据中的应用效果。本文的主要创新点如下:(1)针对单细胞转录组数据特点,设计一种有效的数据预处理方法,能够较好的消除不同基因表达值的量纲差异,同时设计一种转录组数据集的热图可视化方法,通过引入黄金标签,指导细胞和基因的顺序重排,使得我们能够清晰的观察到类内紧密、类间稀疏的块状聚集结构,这有利于我们后续分析数据集的差异和发现标记基因。(2)设计一种基于负相关约束的共享近邻和子图划分方法,该方法分为图构建和子图(下面一样修改,统一用子图或集团)合并两个过程。在图构建过程中,改进了传统共享近邻相似性度量方法,通过引入邻居rank排位的思想,更有效地刻画细胞间相似性;然后,在图模型中对每个细胞顶点寻找其准集团...
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 单细胞测序及量化
1.2.2 相似性计算方法
1.2.3 无监督聚类方法
1.3 问题定义及符号描述
1.4 研究内容
第二章 单细胞转录组数据特点及预处理
2.1 转录组数据特点
2.2 预处理与可视化
2.3 聚类评价指标
2.4 本章小结
第三章 基于负相关约束的共享近邻和子图划分方法
3.1 相关技术
3.2 方法描述
3.3 实验结果
3.3.1 聚类性能评估
3.3.2 参数敏感性分析
3.4 本章小结
第四章 基于矩阵分解的特征子空间聚类方法
4.1 相关技术
4.2 方法描述
4.3 实验结果
4.4 本章小结
第五章 基于图去噪的社团发现方法
5.1 相关技术
5.2 方法描述
5.3 实验结果
5.4 本章小结
第六章 总结与展望
参考文献
攻读硕士学位期间的科研成果
致谢
本文编号:3921581
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 单细胞测序及量化
1.2.2 相似性计算方法
1.2.3 无监督聚类方法
1.3 问题定义及符号描述
1.4 研究内容
第二章 单细胞转录组数据特点及预处理
2.1 转录组数据特点
2.2 预处理与可视化
2.3 聚类评价指标
2.4 本章小结
第三章 基于负相关约束的共享近邻和子图划分方法
3.1 相关技术
3.2 方法描述
3.3 实验结果
3.3.1 聚类性能评估
3.3.2 参数敏感性分析
3.4 本章小结
第四章 基于矩阵分解的特征子空间聚类方法
4.1 相关技术
4.2 方法描述
4.3 实验结果
4.4 本章小结
第五章 基于图去噪的社团发现方法
5.1 相关技术
5.2 方法描述
5.3 实验结果
5.4 本章小结
第六章 总结与展望
参考文献
攻读硕士学位期间的科研成果
致谢
本文编号:3921581
本文链接:https://www.wllwen.com/projectlw/swxlw/3921581.html