当前位置:主页 > 管理论文 > 统计学论文 >

基于指数族图模型的网络聚类算法在单细胞测序数据中的应用

发布时间:2024-05-19 06:38
  近年来随着对肿瘤疾病的深入研究,许多新的癌症亚型不断被发现,根据传统方法划分地肿瘤类型无法满足当前的临床需求,人们逐渐意识到在单细胞层面上进行肿瘤异质性研究的重要性。单细胞RNA-Seq技术的出现使得异质性的研究在单细胞层面上成为可能,它能提供单个细胞内近万个基因的表达信息,为理解基因型和表现型之间的关系、全面揭示细胞间基因表达的异质性提供了有力的工具。然而遗传网络总是异构的,传统的统计网络模型不足以捕获这种特性,导致单细胞测序数据中的网络信息不能被充分利用,造成遗传信息的浪费。在本文中,我们提出了基于指数族图的混合网络聚类算法(Mixture ERGM),并将模型算法运用到单细胞测序数据之中,考虑到由于任何聚类算法都会得到相应的细胞簇,因此对聚类结果进行WGCNA分析和富集性分析检验,同时对聚类结果进行RP分析处理,找出基因表达数据中的差异表达基因,利用不同细胞类型内部高表达基因的模块参与的功能与细胞类型间的紧密关系,通过对差异表达基因以及与其相关蛋白质的富集分析和生物学通路研究,达到揭示细胞异质性的目的。

【文章页数】:48 页

【学位级别】:硕士

【部分图文】:

图3.1使用MixtureERGM对三组模拟数据集进行网络聚类后与真实集群的比较结果

图3.1使用MixtureERGM对三组模拟数据集进行网络聚类后与真实集群的比较结果

青岛大学硕士学位论文14经过模拟数据的检验,我们可以发现MixtureERGM算法不仅能对数据进行统计层面有效的聚类,并且在对潜在子网络的拟合上展现出了不错的效果,是一种合理有效的网络聚类算法。图3.1使用MixtureERGM对三组模拟数据集进行网络聚类后与真实集群的比较结果注....


图3.2模拟数据集的拟合优度图

图3.2模拟数据集的拟合优度图

青岛大学硕士学位论文15(B)集群2的拟合优度图(C)集群3的拟合优度图图3.2模拟数据集的拟合优度图注a.在(A)(B)(C)图中,纵轴是相对频率的对数;观察到的网络的统计数据用实线表示;箱线图包括中位数和四分位数范围;浅灰色的线代表了95%的模拟观测范围。


图3.5cluster1中共高表达基因集合的富集分析结果

图3.5cluster1中共高表达基因集合的富集分析结果

青岛大学硕士学位论文183.3(A)(C)(E)中显示的共表达程度较高的基因集合,同时将共高表达基因集合组成的网络导入到Cytoscape中进行可视化,结果如图3.4所示。(A)cluster1共高表达基因集合的网络视图(B)cluster2共高表达基因集合的网络视图(C)clu....


图3.7cluster5中共高表达基因集合的富集分析结果

图3.7cluster5中共高表达基因集合的富集分析结果

青岛大学硕士学位论文20的节点通常彼此接近;图3.6(C)中的富集术语由p值进行着色,其中包含更多基因的节点往往具有更显著的p值。(A)cluster5中共高表达基因集合的富集术语(B)由集群ID对富集术语着色的网络集群(C)由p-value对富集术语着色的网络集群图3.7clu....



本文编号:3977741

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3977741.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户177b8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com