面向单细胞转录组测序数据的细胞类型预测方法研究
发布时间:2021-05-06 23:55
单细胞转录组测序技术的兴起,将人们的研究聚焦于一个细致的精度——细胞。所属不同类型的细胞构成了人体组织的异质性,而单细胞转录组测序数据从基因表达的水平帮助我们理解与解释单个细胞的性质与组织的异质性。当前基于无监督聚类再通过文献调研进行细胞类型预测的方法在面对日益增长的数据规模需要耗费大量的时间。而随着单细胞测序技术的发展,一个关键的分析挑战是如何充分利用已有信息整合成的参考图谱以更好地对新的测序数据的细胞类型进行识别。在这里,我们提出了一个新的迁移学习算法,通过对参考图谱和新的测序数据分别构建神经网络以实现数据降维和类标迁移的目的。对于参考图谱数据,基于深度分类模型构建维度递减的三层非线性神经网络以获得参考图谱数据的编码特征并以此训练分类器;对于新的测序数据,构建自编码器以保存数据原始的全局结构并且利用自编码器学习的编码特征完成细胞类型的预测;建立属于相同类型的样本的分布应趋于相同的假设将参考图谱的类别信息迁移到新的测序数据中以获得新的测序数据的细胞类型信息。我们通过在人类胰腺组织数据集和人类外周血单核细胞数据集上实验发现本文方法的学习过程对于由测序技术和平台导致的批次效应有一定的校正...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:50 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究现状
1.3 贡献与创新
1.4 本文的组织结构
第二章 理论基础
2.1 深度学习
2.1.1 自编码器
2.1.2 深度分类模型
2.1.3 神经网络的优化算法
2.2 迁移学习
2.3.1 迁移学习背景
2.3.2 基本概念
2.3.3 领域自适应
第三章 联合神经网络细胞类型预测模型
3.1 模型的概述
3.1.1 源域的神经网络的构建
3.1.2 目标域细胞类型的预测
3.1.3 模型总结
3.2 算法流程
第四章 结果展示与应用
4.1 数据与评估准则
4.1.1 人类胰腺组织数据集
4.1.2 人类外周血单核细胞数据集
4.1.3 评估准则
4.2 实验结果
4.2.1 数据预处理
4.2.2 迭代过程可视化
4.2.3 批次效应校正可视化
4.2.4 细胞类型预测结果比较
第五章 总结与展望
参考文献
附录
致谢
本文编号:3172845
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:50 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究现状
1.3 贡献与创新
1.4 本文的组织结构
第二章 理论基础
2.1 深度学习
2.1.1 自编码器
2.1.2 深度分类模型
2.1.3 神经网络的优化算法
2.2 迁移学习
2.3.1 迁移学习背景
2.3.2 基本概念
2.3.3 领域自适应
第三章 联合神经网络细胞类型预测模型
3.1 模型的概述
3.1.1 源域的神经网络的构建
3.1.2 目标域细胞类型的预测
3.1.3 模型总结
3.2 算法流程
第四章 结果展示与应用
4.1 数据与评估准则
4.1.1 人类胰腺组织数据集
4.1.2 人类外周血单核细胞数据集
4.1.3 评估准则
4.2 实验结果
4.2.1 数据预处理
4.2.2 迭代过程可视化
4.2.3 批次效应校正可视化
4.2.4 细胞类型预测结果比较
第五章 总结与展望
参考文献
附录
致谢
本文编号:3172845
本文链接:https://www.wllwen.com/projectlw/swxlw/3172845.html
教材专著