单细胞RNA测序数据挖掘算法研究

发布时间:2023-05-30 18:39
  近些年发展的基于高通量测序的单细胞RNA测序(single cell RNA-sequencing,scRNA-seq)技术能够在单个细胞粒度上进行基因表达测序,进而可以获得单个细胞内数万个基因的表达信息,这为区分不同类型细胞的基因表达特征和全面揭示细胞之间的异质性提供了支撑。但是由于测序技术的限制以及基因表达高度复杂等原因,单细胞RNA测序数据存在噪声较大、维度过高、稀疏性较强等特点,这导致传统聚类技术对不同细胞种群的聚类精度较低。为了提高不同细胞种群的聚类精度,本文基于scRNA-seq数据对如何提高细胞种群识别的准确率进行了研究。通过分析传统scRNA-seq数据处理方法在数据预处理、降维和聚类等方面存在的问题,提出了利用自动编码器作为降维技术的方法。基于堆栈降噪自动编码器(Stacked Denoising Auto Encoder,SDAE)能够最大程度降低数据损耗、对噪声数据具有良好的处理能力等特点,提出了SDAE-DBSCAN和SDAE-K-means两种降维-聚类方法。实验表明,本文提出的降维-聚类方法降低了原有算法对参数的依赖性,提高了对细胞种群的聚类精度。主要研究内...

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题研究背景及意义
    1.2 国内外研究现状
    1.3 论文研究的主要内容
    1.4 论文的组织结构安排
第2章 现有scRNA-seq数据处理方法分析
    2.1 数据格式及特点
    2.2 数据预处理
    2.3 数据降维
    2.4 数据聚类
    2.5 本章小结
第3章 scRNA-seq数据分析方案设计
    3.1 研究技术路线
    3.2 数据集
    3.3 实验环境
    3.4 数据预处理
    3.5 本章小结
第4章 基于堆栈降噪自动编码器的数据降维分析
    4.1 深度学习
    4.2 自动编码器
    4.3 降噪自动编码器
    4.4 堆栈降噪自动编码器
    4.5 实验分析
    4.6 本章小结
第5章 基于DBSCAN和 K-means的数据聚类分析
    5.1 自适应计算参数值的DBSCAN聚类算法
    5.2 K-means聚类
    5.3 聚类结果评价指标
    5.4 实验分析
    5.5 本章小结
第6章 总结与展望
    6.1 本文主要工作与结论
    6.2 本文主要创新点
    6.3 本文存在的不足及未来研究方向
参考文献
后记
攻读硕士学位期间论文发表及科研情况



本文编号:3824820

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3824820.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d312***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com