当前位置:主页 > 管理论文 > 领导决策论文 >

基于决策树算法的癌症合成致死基因组合的预测及预后分析

发布时间:2021-11-24 23:17
  癌症治疗一直都是世界性难题。近年来,合成致死(Synthetic lethality)已经成为一种抗癌药物研发的新思路,针对两个存在相互作用的基因进行靶向治疗,可有效克服耐药性问题。目前,合成致死疗法所面临的关键问题是在特定癌症类型中获得一批可靠的具合成致死效应的基因,为基于合成致死策略寻找关键基因的可能治疗靶点提供数据参考。由于实验验证成本较高、耗时长且难以大批量开展,利用生物信息学手段预测可靠的合成致死基因组合已成为了一种重要方法。因此,本文基于已知合成致死基因组合的相关分子特征,通过机器学习算法预测了不同癌症中的合成致死基因组合,并针对相关数据进行了分析,同时构建了数据库。首先,基于TCGA数据库(The Cancer Genome Atlas)中33种癌症的测序数据,从基因突变、m RNA表达、甲基化及拷贝数变异(Copy number variation,CNV)四个分子水平展开分析,提取特征并利用决策树模型进行合成致死基因组合的预测;然后,基于预测结果进行分析,以了解具合成致死效应基因的可能生物学功能及在癌症预后中的价值等;最后,为了共享合成致死基因组合的预测结果,本文搭建... 

【文章来源】:南京邮电大学江苏省

【文章页数】:119 页

【学位级别】:硕士

【部分图文】:

基于决策树算法的癌症合成致死基因组合的预测及预后分析


合成致死效应示意图(概念参考:O"Neil等[4])

内容,致死基因


南京邮电大学硕士研究生学位论文第一章绪论7存分析的可视化分析功能,为全世界的相关科研人员提供了一个具有在线分析功能的数据参考平台。图1.2本文主要研究内容1.4.2本文结构安排本文共有六个章节,具体章节安排如下:第一章:绪论。本章主要介绍了合成致死的概念及在癌症治疗中的优势、国内外相关领域的发展及应用情况,以及本文的研究目标,并对本文主要工作进行了概述。第二章:多组学数据分析预测与相关原理。本章节主要介绍了多分子水平数据分析与机器学习模型的相关理论知识、近年来国内外已经公开的预测合成致死基因组合的常用方法和数据库原理,并对预测合成致死基因组合的难点进行了分析。第三章:基于多组学数据利用决策树模型预测合成致死基因组合。本章节主要介绍了基于多组学数据集成分析预测合成致死基因组合的方法,并重点介绍了数据预处理方法、特征参数选娶模型训练和优化以及模型准确度的验证。第四章:基于合成致死基因组合的预后及功能分析。本章节主要介绍了基于合成致死基因组合的预测结果进行预后分析及功能分析等,主要围绕互作网络、生存、功能及药物敏感性等展开分析,以了解具合成致死效应基因在癌症发生发展中的可能作用。

示例,样本,甲基化,线性模型


南京邮电大学硕士研究生学位论文第二章多组学数据分析预测及相关原理10图2.1TCGA样本编号示例2.2.2针对不同分子水平测序数据的处理在mRNA表达数据的处理中,测序数据中的表达量通常使用RPKM/FPKM表示,其中TCGA数据库[50]中使用RPKM。通常研究人员们较为关注的是表达差异这一指标,即癌症样本与对照样本之间的表达差异,通常使用倍数变化(Foldchange,FC)、p值和错误发现率(Falsediscoveryrate,FDR)值来描述表达的差异性。目前,有多种分析工具及R包可以对表达差异进行分析。较常见的有EdgeR[52]、limma等。NCBI(TheNationalCenterforBiotechnologyInformation)中的GEO(GeneExpressionOmnibus)数据库[53]也有在线分析工具可供使用。甲基化是发生在DNA分子水平的重要生物学过程,甲基化程度作为该分子水平的一个重要指标,通常由Bate-Value值来描述,Bate-Value值为一个大小在0-1之间的值,其中1表示完全甲基化,0表示不发生甲基化[54]。拷贝数变异(Copynumbervariation,CNV)是发生在基因中的较为重要的变化之一,其状态通常由扩增、缺失和无变化来描述。TCGA数据库[50]的原始数据采用了5个离散的变量,包括-2、-1、0、1和2,来描述拷贝数变异的状态,分别表示纯合性缺失、半合性缺失、无变化、扩增和高水平扩增[54]。针对拷贝数变异的研究通常采用变化程度或发生扩增/缺失的比例作为指标。2.2.3线性模型与决策树模型基础理论知识(1)线性模型线性模型(Linearmodel)是机器学习的一种常见模型[55],其以形式简单、易于建模等特点被广泛应用。线性模型通过学习一个带有属性的线性组合来得到预测函数:()=11+22+++(2.1)

【参考文献】:
期刊论文
[1]PARP抑制剂在子宫内膜癌治疗中的研究进展[J]. 曾靖,尹如铁.  实用妇产科杂志. 2020(01)
[2]基于合成致死策略寻找ARID1A突变肝细胞癌的治疗靶点[J]. 王光兴,石毅,王小晟,张跃,韩泽广,何昆燕.  基因组学与应用生物学. 2019(07)
[3]PARP抑制剂治疗晚期乳腺癌的作用机制及相关研究进展[J]. 吴静,曾晓华.  中国肿瘤临床. 2019(11)

博士论文
[1]基于多模态数据融合的乳腺癌生存期预测研究[D]. 孙冬冬.中国科学技术大学 2018
[2]基于纳米胶束的Micelleplex输送小干扰RNA用于癌症治疗[D]. 毛成琼.中国科学技术大学 2013
[3]应用合成致死原理筛选胰腺癌对化疗药物反应的关键基因[D]. 冯韵霖.北京协和医学院 2009

硕士论文
[1]酿酒酵母AFR1过量表达与MPK1及MIH1缺失导致的合成致死[D]. 樊纯.天津大学 2009



本文编号:3516943

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3516943.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户74277***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com