针对单细胞数据Dropout现象的聚类算法研究
发布时间:2023-11-05 11:06
近年来,单细胞RNA测序技术得到了广泛的应用。随着技术的不断发展,使人们能够从中获取到大量的单细胞基因表达数据,为后期的研究以及生物信息学的探索奠定了良好的基础。单细胞基因表达数据中蕴藏着大量的生物基因信息,而如何从中分析出有意义的生物结论,揭示细胞基因间的奥秘成为了目前研究的焦点,因此对单细胞RNA测序得到的数据进行后续分析有着重要的意义。目前,聚类分析是研究该数据的重要分析手段,但因数据存在的dropout现象,导致聚类算法无法直接应用于数据中,使得到的结果并不理想。故本文的研究目的是针对单细胞基因表达数据存在的dropout现象进行聚类算法研究。本文研究了当前主流的处理该数据的降维聚类算法,借鉴其思想并进行改进,提出了一种符合数据特点、高效准确的聚类算法。该算法的思想是将降维的思想与处理dropout问题相结合应用到聚类分析中,把降维作为聚类的预处理步骤,在降维的过程中用改进的距离度量、估算插补数据等方法解决dropout问题。在此基础上,本文选择符合数据分布的模型进行聚类,并对聚类初始化的算法进行改进,从而提高了算法的准确性以及缩减了算法运行时间。在实验验证部分,本文选取了两套...
【文章页数】:43 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景
1.2 研究的目的及意义
1.3 国内外研究现状
1.4 本文的主要工作
第2章 预备知识
2.1 PCA降维算法
2.2 聚类分析算法
2.3 EM算法
2.4 本章小结
第3章 算法流程
3.1 处理流程概述
3.2 数据预处理
3.3 基于余弦相似度的降维算法
3.3.1 改进降维算法的思想
3.3.2 改进降维算法实现
3.4 细化初始值的聚类算法
3.4.1 改进聚类算法的思想
3.4.2 改进聚类算法实现
3.5 本章小结
第4章 实证分析
4.1 数据来源
4.2 可视化与结果分析
4.3 算法优劣评价
4.4 本章小结
结论
参考文献
致谢
本文编号:3860910
【文章页数】:43 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景
1.2 研究的目的及意义
1.3 国内外研究现状
1.4 本文的主要工作
第2章 预备知识
2.1 PCA降维算法
2.2 聚类分析算法
2.3 EM算法
2.4 本章小结
第3章 算法流程
3.1 处理流程概述
3.2 数据预处理
3.3 基于余弦相似度的降维算法
3.3.1 改进降维算法的思想
3.3.2 改进降维算法实现
3.4 细化初始值的聚类算法
3.4.1 改进聚类算法的思想
3.4.2 改进聚类算法实现
3.5 本章小结
第4章 实证分析
4.1 数据来源
4.2 可视化与结果分析
4.3 算法优劣评价
4.4 本章小结
结论
参考文献
致谢
本文编号:3860910
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3860910.html
最近更新
教材专著