基于多元数据融合的癌症亚型驱动基因识别算法研究
发布时间:2021-11-22 18:43
乳腺癌是女性中最常见的恶性肿瘤之一,同时是一种异质性疾病。癌症亚型特异性驱动基因的识别对乳腺癌的诊断、预后和治疗具有重要意义。随着下一代测序技术的快速发展,一些大规模的基因组学项目提供了多种癌症类型的大量的多组学数据,其中包括转录组学、基因组学和蛋白质组学等,为全面展开对乳腺癌的分子驱动机制的研究创造了一个前所未有的机会。如何通过整合分析多种类型的组学数据,从突变数据中识别出驱动基因是探索癌症进展的一大挑战。目前还没有稳健的模型能够从这些高异质、强相关的数据中挖掘出乳腺癌亚型相关的驱动基因与驱动通路。因此本论文基于多元数据融合来对驱动基因进行识别研究,从分子亚型来探索与患者预后相关的分子机制。本文的主要工作包括以下两点:(1)提出了一种基于模块网络的数据整合方法来识别亚型特异性驱动基因。首先针对高异质性乳腺癌数据在亚型之间进行差异表达分析,选出差异表达显著的基因数据子集,基于频率方法选出亚型候选调控基因;然后对每一种亚型,利用聚类方法构建初始模块,然后通过模块网络学习建立异质性网络,通过回归树模型建立起不同组学数据之间的调控机制,从而得到最终的模块和亚型驱动基因。最后为了验证驱动基因的...
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及研究意义
1.2 国内外研究现状
1.3 主要研究内容与结构安排
第2章 相关理论基础
2.1 引言
2.2 高通量测序数据集
2.2.1 基因表达数据集合
2.2.2 体细胞突变数据集合
2.2.3 通路数据集
2.2.4 蛋白质相互作用网络数据集
2.3 多组学数据整合方法
2.3.1 基于回归分析的整合方法
2.3.2 基于相关分析的整合方法
2.3.3 基于模块化网络的整合方法
2.4 驱动突变识别方法概述
2.4.1 基于突变频率方法
2.4.2 基于基因功能影响方法
2.4.3 基于结构基因组学方法
2.4.4 基于数据整合方法
2.4.5 基于网络或通路方法
第3章 基于模块网络的亚型驱动基因的挖掘
3.1 引言
3.2 一种基于模块网络的驱动基因识别方法
3.2.1 基因的差异表达分析
3.2.2 候选调控基因的选择
3.2.3 构建初始模块
3.2.4 模块网络的学习
3.2.5 候选驱动基因的选择
3.3 实验结果与分析
3.3.1 LumA亚型特异性驱动基因
3.3.2 Basal/LumB/Her2亚型特异性驱动基因
3.3.3 亚型分类验证
3.3.4 基于拓扑的通路分析
3.3.5 功能性分析
3.4 本章小结
第4章 基于代谢通路网络的亚型驱动基因与通路的挖掘
4.1 引言
4.2 一种基于pathway网络的驱动基因与驱动通路的识别方法
4.2.1 pathway基因初始权重的获取
4.2.2 pathway网络分析构建
4.3 实验结果与分析
4.3.1 代谢通路在不同亚型中的活性
4.3.2 癌症亚型的共性与特异性
4.3.3 亚型分类验证
4.3.4 驱动通路生存分析
4.3.5 功能性分析
4.4 本章小结
结论
参考文献
致谢
附录A 发表论文和参加科研情况说明
【参考文献】:
期刊论文
[1]中国癌症发病、死亡现状与趋势分析[J]. 曾倩,崔芳芳,宇传华,张干深. 中国卫生统计. 2016(02)
[2]用Pearson’s卡方统计量进行统计检验时应注意的问题[J]. 陆运清. 统计与决策. 2009(15)
[3]一种肿瘤基因表达数据的知识提取方法[J]. 李颖新,刘全金,阮晓钢. 电子学报. 2004(09)
本文编号:3512251
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及研究意义
1.2 国内外研究现状
1.3 主要研究内容与结构安排
第2章 相关理论基础
2.1 引言
2.2 高通量测序数据集
2.2.1 基因表达数据集合
2.2.2 体细胞突变数据集合
2.2.3 通路数据集
2.2.4 蛋白质相互作用网络数据集
2.3 多组学数据整合方法
2.3.1 基于回归分析的整合方法
2.3.2 基于相关分析的整合方法
2.3.3 基于模块化网络的整合方法
2.4 驱动突变识别方法概述
2.4.1 基于突变频率方法
2.4.2 基于基因功能影响方法
2.4.3 基于结构基因组学方法
2.4.4 基于数据整合方法
2.4.5 基于网络或通路方法
第3章 基于模块网络的亚型驱动基因的挖掘
3.1 引言
3.2 一种基于模块网络的驱动基因识别方法
3.2.1 基因的差异表达分析
3.2.2 候选调控基因的选择
3.2.3 构建初始模块
3.2.4 模块网络的学习
3.2.5 候选驱动基因的选择
3.3 实验结果与分析
3.3.1 LumA亚型特异性驱动基因
3.3.2 Basal/LumB/Her2亚型特异性驱动基因
3.3.3 亚型分类验证
3.3.4 基于拓扑的通路分析
3.3.5 功能性分析
3.4 本章小结
第4章 基于代谢通路网络的亚型驱动基因与通路的挖掘
4.1 引言
4.2 一种基于pathway网络的驱动基因与驱动通路的识别方法
4.2.1 pathway基因初始权重的获取
4.2.2 pathway网络分析构建
4.3 实验结果与分析
4.3.1 代谢通路在不同亚型中的活性
4.3.2 癌症亚型的共性与特异性
4.3.3 亚型分类验证
4.3.4 驱动通路生存分析
4.3.5 功能性分析
4.4 本章小结
结论
参考文献
致谢
附录A 发表论文和参加科研情况说明
【参考文献】:
期刊论文
[1]中国癌症发病、死亡现状与趋势分析[J]. 曾倩,崔芳芳,宇传华,张干深. 中国卫生统计. 2016(02)
[2]用Pearson’s卡方统计量进行统计检验时应注意的问题[J]. 陆运清. 统计与决策. 2009(15)
[3]一种肿瘤基因表达数据的知识提取方法[J]. 李颖新,刘全金,阮晓钢. 电子学报. 2004(09)
本文编号:3512251
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3512251.html
最近更新
教材专著