当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于基因组学数据的致癌信号通路研究

发布时间:2020-10-29 13:19
   癌症基因组图谱计划(TCGA)、国际癌症基因组联盟(ICGC)等大规模国际项目已经对数十种癌症类型的成千上万例癌症病人进行测序并生成了大量的癌症基因组数据。分析这些数据的非常重要的挑战问题是,如何有效区分与癌症发生发展密切相关的驱动突变和与癌症的发生发展没有关系的伴随突变?另外,癌症是基因以及信号通路的疾病,如何识别导致癌症的驱动基因以及信号通路?由于最终确定一个突变是否为驱动突变需要测试其生物功能,而我们目前检测突变的能力远远超过通过实验验证其生物功能的能力。因此,通过计算方法预测可能的驱动突变势在必行。本文的研究主要集中在如何利用组合优化方法预测未知的癌症驱动突变、基因以及信号通路。这对于研究和理解癌症的分子机制和发病机理以及癌症的用药治疗等相关问题意义重大。癌症数据的急剧增加为癌症的研究带来无限机遇的同时,设计有效的计算方法分析当前的数据也面临前所未有的挑战。癌症突变的异质性极大地降低了通过识别频发突变和频发突变基因预测驱动突变和驱动基因的能力。对癌症突变异质性的一个解释是,除了伴随突变的存在之外,驱动突变攻击细胞的信号通路。信号通路在不同病人中的不同突变导致了其功能异常。一些检测已知信号通路或者功能模块的突变富集程度的方法被研发出来。这些方法的局限性在于其所依赖的已知信号通路或者功能模块的信息到目前为止并不完整。根据目前对癌症突变过程的理解,驱动信号通路中的突变展现出两种组合模式:相互排斥性和高覆盖性。基于相互排斥性和高覆盖性识别信号通路的方法主要分为组合学方法和统计学方法。然而,目前的组合学方法不能保证识别出的基因集合具有排斥性,而统计学方法在计算效率上又存在明显的不足。这导致已有方法在实际应用中效果并不理想。另外,仅利用突变数据及其组合性质识别得到的基因集合不一定具有真实的功能相关性。结合更多类型的数据可以提高预测的准确率。例如,一些方法结合蛋白相互作用网络的信息,致力于识别网络上的高频突变子网络。然而,结合多种数据类型系统识别具有排斥性和高覆盖性的驱动信号通路仍然是一大难题。本文中,我们设计了新的结合癌症突变数据和蛋白相互作用网络数据的方法CovEx,系统识别具有排斥性和高覆盖性的驱动信号通路。我们的方法主要分为以下几步:首先,我们基于蛋白相互作用网络利用随机游走方法构造流网络。流网络中连边的基因对具有较强的拓扑相关性。我们将驱动信号通路中的基因集合的搜索限制在流网络的具有较强拓扑相关性的局部网络上。通过对大量局部网络的系统搜素,我们能够实现对突变数据集有效信息的深度挖掘。由于基因集合排斥性和覆盖度之间的平衡关系,我们设计了二步法进行搜索和筛选。我们基于线性组合指标对每一个局部网络利用线性规划求解候选基因集合,并继续利用新设计的非线性指标对候选基因集合进行评估和筛选。线性指标的不足在于,部分求解得到的基因集合的目标函数值被其中的高频突变基因主导而不具有排斥性。新设计的指标能够保证基因集合中的每一个基因都能对整体的指标值做出显著的贡献,能够对候选基因集合进行有效评估。最后,针对癌症的异质性,我们设计了最小集合覆盖模型推断每一个病人特异的基因模块及其驱动信号通路。这对于癌症个体化治疗的发展具有重要的推动意义。我们分析了包括十二种癌症类型的泛癌症突变数据集,且对十二种单种类型的癌症数据集分别进行了分析。特别地,我们用不同数据库的三种不同的蛋白相互作用网络数据分别进行实验。为了进一步提高预测的精准度,我们设计了综合三种蛋白相互作用网络数据下实验结果的一致性方法。一致性方法修正了单个蛋白相互作用网络数据下的结果,并综合得到不同结果中一致的驱动信号通路。我们以不同数据库注释的癌症基因为基准分析了不同参数和网络数据下得到的预测结果的敏感度和准确率。经过一致性方法修正后的结果具有更高的准确率。通过与HotNet2等经典方法的结果比较,CovEx的结果具有更高的敏感度和准确率。通过与已知信号通路和GO功能模块的比对分析,我们预测了相应的驱动信号通路与GO功能模块。CovEx仍然存在不足之处。比如:1)部分求解到的基因集合的目标函数值被其中的少数高频突变基因主导,其生物价值很难确定。2)软件在设计过程中没有实现并行化,在不同局部网络上线性规划的求解实现并行化是未来努力的方向。3)考虑到新设计组合指标的非线性性质以及覆盖度和排斥性之间的权衡,我们只依据其筛选利用原有线性目标函数求解得到的基因集合,而没有直接针对新指标进行求解。因此,部分局部网络上的重要基因集合可能不能被识别出来。依据新指标直接求解候选基因集合并且综合分析多种方法得到的候选基因集合可能进一步提高识别到驱动信号通路中的基因集合的能力。针对CovEx的不足,本文另外介绍了一种识别癌症中关键均匀互斥突变基因集合的方法UniCovEx。相比于一般意义的基因突变的排斥性,均匀排斥性有助于正确识别驱动信号通路中的基因集合。我们引入排斥熵的概念评估目标基因集合的均匀排斥性,并设计相应的算法。实验结果表明,UniCovEx算法可以作为CovEx算法的有效补充。另外,我们设计了 comCovEx算法识别不同癌症类型公共驱动基因集合及其信号通路。在comCovEx算法的基础上,我们研究了不同癌症类型之间的相关性。我们的方法CovEx和UniCovEx已经用C++语言实现成开源的软件,可以通过以下网址下载:https://sourceforge.net/projects/cancer-pathway/files/。
【学位单位】:山东大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:O224;R730.2
【部分图文】:

示例,功能,癌症


伴随着驱动突变或其它功能相关的变异发生的,对肿瘤没有功能上的驱动性。这些??突变被称为伴随突变(passenger?mutations)[15]。有关驱动突变与伴随突变在功能上的??不同,可进一步参见图1.1。从癌症的伴随突变中区分出驱动突变可以帮助我们确定??致癌机制以及用药靶点,并进一步设计癌症病人特异的治疗方案。然而,区分伴随??突变和驱动突变也是癌症研宄中最基础而又非常具有挑战性的问题[16-18]。一些关??键的驱动突变,例如TP53功能缺失突变,可以通过检测其在一组肿瘤变异数据中??的高突变率的显著性而识别到。然而,另一些不同基因上的突变同样对癌症具有驱??动功能,其突变率却相对较低。由于癌症变异的异质性,相同癌症类型的病人展示??3??

恶性胶质瘤,拷贝数,排斥性


相应基因拷贝数选择性增加;蓝色代表纯合子缺失;绿色代表突变。相关数据源自TCGA恶性??胶质瘤GBM?(glioblastoma?multiforme)数据集。总共有78%的病人在这三个基因中的至少一个基??因上发生变异,且只有两个病人在这三个基因中的多于一个基因上发生变异。CDKN2A,?CDK4??编码信号网络中的上游蛋白。即使RB1仅仅在11%的病人上发生变异,其活性仍潜在地受到其??它两个基因变异的影响。该图引自文献[92]。??同一功能模块或信号通路上不同驱动突变在各个肿瘤样本中具有排斥性。这为??从计算上识别致病功能模块或信号通路开启了新的思路。对具有排斥性性质的突变??及基因的研宄是从头预测致癌信号通路并确定潜在治疗靶点的重要步骤。??基因变异的排斥性性质最早被Yeang等人系统应用以检测癌症中的驱动基因集??合[93]。虽然Yeang等人的研宄局限于基因数量相对较少,并且其检验基因对排斥性??的随机置换检验方法计算复杂度太高的问题,但是这项研究开启了分析具有排斥性??性质的功能相关的基因集合的先例。基因突变的排斥性也被很多实验证实跟功能信??号通路与合成致死等密切相关[94-96]。因此,基因的互斥模式对理解癌症演化非常??

实例图,基因对,最短距离,拓扑关系


评定蛋白相互作用网络中基因对之间拓扑相关性的一种方法是求该基因对之间??的最短距离。然而,这种方法在很多情况下无法区分一些基因对之间拓扑相关性的??差异,而这种差异会对驱动信号通路的识别具有重要的影响。例如,考虑图2.1中??基因对的拓扑关系可能出现的两种情况。在其中一种情况下,两个突变基因在蛋白??相互作用网络的一条线性链上。而在另一种情况下,两个基因由一个连接较多基因??的中心基因相连。相比于后一种情况,在搜索中前一种情况的出现将具有更小的随??机性,因而对我们的问题而言也更加重要。蛋白相互作用网络中的连接较多基因的??枢纽基因的存在可能导致很多实际上无效的基因集合被各种算法识别出来。由于一??些高频突变基因,例如TP53,在蛋白相互作用网络中连接着众多基因。这些基因的??存在使得我们应当重新评估基因对之间的拓扑相关性。由于并不是所有驱动信号通??路在蛋白相互作用网络上都是稠密的[102],因此,通过挖掘蛋白相互作用网络中的??稠密子图识别强拓扑相关基因集合的方法对我们的问题而言并不合适。??16??
【相似文献】

相关期刊论文 前10条

1 范久亿;李军;丁士刚;;Wnt信号通路在结直肠侧向发育型肿瘤中的研究进展[J];胃肠病学;2018年11期

2 王雪;张评浒;;Ras/Raf/MEK/ERK信号通路参与自噬调控作用的研究进展[J];中国药科大学学报;2017年01期

3 许莹萍;王菲菲;李大金;王凌;;雌激素-雌激素受体信号通路对趋化因子的调控作用研究进展[J];生殖医学杂志;2017年09期

4 苏依拉其木格;;Hedgehog信号通路在肺癌中的研究进展[J];健康之路;2016年09期

5 滕振平;邢飞跃;;细胞外信号调节激酶1/2信号通路对B淋巴细胞的影响[J];中国药物与临床;2007年01期

6 杜婵;姜保国;;许旺细胞增殖和分化过程中的信号通路[J];中国组织工程研究与临床康复;2007年03期

7 史琳琳;赵锋;高学军;李庆章;;乳蛋白合成信号通路的研究进展[J];中国畜牧兽医;2013年01期

8 舒扬;向敏;;Wnt信号通路在中枢神经系统中的作用及相关机制[J];江苏医药;2018年08期

9 刘晓光;陈佩杰;肖卫华;;Wnt信号通路在骨骼肌损伤修复过程中的作用及机制研究[J];生命的化学;2018年05期

10 刘艳芳;吴志远;;分子信号通路在瘢痕疙瘩中的研究进展[J];海南医学;2017年07期


相关博士学位论文 前10条

1 连海伟;靶向急性T淋巴细胞白血病中CK2和NOTCH1/MYC信号通路的研究[D];武汉大学;2017年

2 王冬冬;基于仿生纳米材料的光热效应在疾病治疗中的应用[D];北京科技大学;2019年

3 高勃;基于基因组学数据的致癌信号通路研究[D];山东大学;2018年

4 张辉;Erythropoietin信号通路对成体大鼠脊髓内源性神经干细胞增殖分化作用的实验研究[D];安徽医科大学;2018年

5 吴慧;活性多肽的表达及功能研究[D];国防科学技术大学;2017年

6 韩晶晶;Nrf2信号通路在急性移植物抗宿主病中的作用及机制研究[D];苏州大学;2018年

7 朱建伟;MAPK/纤调蛋白信号通路在氧化应激介导慢性胰腺炎纤维化中的机制研究[D];中国人民解放军海军军医大学;2018年

8 孙海涛;NF-κB P65通过Wnt信号通路调控HSCs活化的分子机制及鳖甲寡肽I-C-F-6的干预作用[D];南方医科大学;2018年

9 鲁茜;TGF-β1/PI3K/Akt信号通路在糖尿病肾病中的作用[D];南京医科大学;2013年

10 王凡;HIF-1信号通路在多囊卵巢综合征中的作用及其调控机制[D];福建师范大学;2017年


相关硕士学位论文 前10条

1 邵金辉;LRP4在肢端骨骼发育进程中的功能初探[D];西北大学;2018年

2 赵伟康;基于单目视觉的车道线检测和车辆检测方法研究[D];南京航空航天大学;2018年

3 孙袁博;面向DVB-S2系统的同步技术研究[D];西安电子科技大学;2018年

4 乔佳彬;面向混部云的性能评测方法的研究[D];大连理工大学;2018年

5 吴雷;自噬与Wnt信号通路在胎鼠皮层神经元缺氧缺血损伤中的相互作用[D];江苏大学;2018年

6 唐媛媛;JAK2/STAT3信号通路在激动表皮生长因子受体抗大鼠脑缺血/再灌注损伤中的作用及机制[D];蚌埠医学院;2018年

7 郑晴晴;构巢曲霉中与钙调磷酸酶Calcineurin相关的salA、vnxA、akrA的基因敲除以及功能研究[D];南京师范大学;2015年

8 沈龙艳;Hedgehog信号调节Sufu蛋白细胞定位的机制研究[D];南京医科大学;2016年

9 刘怀泽;SENP1通过调控Glil的去SUMO化过程抑制Hedgehog信号通路[D];南京医科大学;2016年

10 张洁;冬眠不同时期达乌尔黄鼠骨路肌中内盾网应激介导的PERK信号通路的作用研究[D];西北大学;2018年



本文编号:2860956

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2860956.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1f5a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com