基于癌症组学数据网络分析的驱动基因识别算法研究
发布时间:2023-04-23 06:18
癌症本质上与基因变异有关,目前人们普遍认为,有一小部分发生变异的基因具有选择生长优势,对癌症发生发展过程有促进作用,一般称之为驱动基因。大部分发生变异的基因对癌症发生发展没有促进作用,称之为乘客基因。在众多的乘客基因中识别驱动基因是癌症研究的热点问题。围绕这一目标,很多驱动基因识别算法应运而生,特别地,鉴于基因之间存在相互作用关系,且从网络角度可以更加系统地研究癌症特点,因此,已有很多基于网络的方法被用来挖掘癌症驱动基因。但是仍然有很多特征对驱动基因识别有影响,例如基因长度对突变概率的影响、先验知识的影响以及网络拓扑结构特征的影响等。另外,除了对单一癌症识别驱动基因外,有研究表明不同癌症之间可能存在相同的特点和致病基因。本文针对上述问题开展了系统性研究,主要工作如下:(1)提出了一种基于基因长度校正突变概率的驱动基因识别算法LNDriver,本算法考虑了基因长度对基因突变概率的影响。对于体细胞突变数据,通过广义加性模型,根据突变基因长度,对其突变概率进行校正,从而过滤由于长度过长产生的假阳性基因。然后根据蛋白质-蛋白质相互作用网络,将筛选后的基因突变数据与表达数据整合并构建二分图,最后...
【文章页数】:115 页
【学位级别】:博士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 引言
1.2 课题研究背景及意义
1.3 国内外研究现状
1.3.1 基于突变频率的驱动突变/基因识别算法
1.3.2 基于功能影响的驱动突变/基因识别算法
1.3.3 基于结构基因组的驱动突变/基因识别算法
1.3.4 基于通路和网络分析的驱动基因识别算法
1.3.5 驱动通路或驱动模块识别算法
1.4 本文的研究内容和安排
第二章 相关知识概述
2.1 引言
2.2 驱动基因与乘客基因
2.3 TCGA数据库
2.4 多组学数据
2.4.1 基因组数据
2.4.2 转录组数据
2.4.3 蛋白质组数据
2.5 复杂网络
2.5.1 网络的定义
2.5.2 网络的表示方法
2.5.3 网络的分类
2.5.4 网络的一般属性
2.5.5 网络的中心性
2.6 本章小结
第三章 基于二分图的驱动基因识别
3.1 引言
3.2 Driver Net算法
3.3 基于基因长度校正的癌症驱动基因识别算法
3.3.1 算法流程
3.3.2 实验数据
3.3.3 实验结果
3.3.4 总结与讨论
3.4 基于基因长度校正及共表达网络的驱动基因识别算法
3.4.1 算法流程
3.4.2 实验数据
3.4.3 实验结果
3.4.4 总结与讨论
3.5 本章小结
第四章 基于随机游走算法的驱动基因识别
4.1 引言
4.2 随机游走算法相关知识简介
4.2.1 传统随机游走算法
4.2.2 重启动随机游走算法介绍
4.3 算法流程
4.3.1 癌症相关网络的构建
4.3.2 种子基因的选择
4.3.3 网络节点中心性计算
4.3.4 改进的随机游走算法
4.4 实验结果
4.4.1 实验数据
4.4.2 对已知癌症基因预测性能评估
4.4.3 转移矩阵改进分析
4.4.4 种子节点选择的分析
4.4.5 前10个候选驱动基因分析
4.5 本章小结
第五章 基于多层网络的驱动基因识别
5.1 引言
5.2 传统NMF算法简介
5.3 算法流程
5.3.1 多层网络的构建
5.3.2 Driver-MulJNMF算法介绍
5.3.3 算法评估
5.3.4 参数选择
5.4 实验结果
5.4.1 实验数据
5.4.2 Hallmark富集分析及比较
5.4.3 文献检索分析
5.4.4 通路和功能富集分析
5.4.5 生存分析
5.5 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
攻读博士学位期间取得的研究成果
致谢
本文编号:3799268
【文章页数】:115 页
【学位级别】:博士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 引言
1.2 课题研究背景及意义
1.3 国内外研究现状
1.3.1 基于突变频率的驱动突变/基因识别算法
1.3.2 基于功能影响的驱动突变/基因识别算法
1.3.3 基于结构基因组的驱动突变/基因识别算法
1.3.4 基于通路和网络分析的驱动基因识别算法
1.3.5 驱动通路或驱动模块识别算法
1.4 本文的研究内容和安排
第二章 相关知识概述
2.1 引言
2.2 驱动基因与乘客基因
2.3 TCGA数据库
2.4 多组学数据
2.4.1 基因组数据
2.4.2 转录组数据
2.4.3 蛋白质组数据
2.5 复杂网络
2.5.1 网络的定义
2.5.2 网络的表示方法
2.5.3 网络的分类
2.5.4 网络的一般属性
2.5.5 网络的中心性
2.6 本章小结
第三章 基于二分图的驱动基因识别
3.1 引言
3.2 Driver Net算法
3.3 基于基因长度校正的癌症驱动基因识别算法
3.3.1 算法流程
3.3.2 实验数据
3.3.3 实验结果
3.3.4 总结与讨论
3.4 基于基因长度校正及共表达网络的驱动基因识别算法
3.4.1 算法流程
3.4.2 实验数据
3.4.3 实验结果
3.4.4 总结与讨论
3.5 本章小结
第四章 基于随机游走算法的驱动基因识别
4.1 引言
4.2 随机游走算法相关知识简介
4.2.1 传统随机游走算法
4.2.2 重启动随机游走算法介绍
4.3 算法流程
4.3.1 癌症相关网络的构建
4.3.2 种子基因的选择
4.3.3 网络节点中心性计算
4.3.4 改进的随机游走算法
4.4 实验结果
4.4.1 实验数据
4.4.2 对已知癌症基因预测性能评估
4.4.3 转移矩阵改进分析
4.4.4 种子节点选择的分析
4.4.5 前10个候选驱动基因分析
4.5 本章小结
第五章 基于多层网络的驱动基因识别
5.1 引言
5.2 传统NMF算法简介
5.3 算法流程
5.3.1 多层网络的构建
5.3.2 Driver-MulJNMF算法介绍
5.3.3 算法评估
5.3.4 参数选择
5.4 实验结果
5.4.1 实验数据
5.4.2 Hallmark富集分析及比较
5.4.3 文献检索分析
5.4.4 通路和功能富集分析
5.4.5 生存分析
5.5 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
攻读博士学位期间取得的研究成果
致谢
本文编号:3799268
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3799268.html
最近更新
教材专著