肝癌易感相关基因及组织基因表达谱生物信息学分析
发布时间:2019-10-08 14:08
【摘要】:第一部分 肝癌易感性相关基因的文献计量学与生物信息学分析研究背景和目的:肝癌在我国属于发病率排名前3位的肿瘤,多数与乙肝病毒感染有关,发病数在全世界排名第一。由于多数肝癌病人确诊时已经肿瘤晚期,发现后有效治疗手段较少,如果能在早期发现,多数小肝癌病人能够获得临床痊愈,因而,如何早期发现肝癌一直是肝癌防治研究的热点和难点。肝癌的发病与肝炎病毒感染、黄曲霉毒素接触等多种危险因素有关,还受吸烟、饮酒、环境致癌物暴露、生活方式、脂肪肝、糖尿病、代谢综合征等多种因素的影响。一直以来,防控乙型肝炎,并针对肝癌高风险人群进行定期体检筛查是发现早期肝癌、提高肝癌生存率的有效方法。由于有肝癌致癌因素的人群众多,其中只有一小部分人最终发展为肝癌,大约85—90%的乙肝携带者始终都是携带者。分子医学研究发现肝癌易感人群的个体差异对是否发生肝癌有一定的影响,通过评估患者的临床特征和基因风险,可以优化肝癌筛查及癌前病变的防治方案。近年来针对肝癌易感基因的研究很多,为了更好的了解肝癌易感性基因的研究动态、发展趋势、寻找关键基因,本研究运用文献计量学和生物信息学方法对相关基因的研究文献及所涉及的相关基因进行系统分析。肝癌易感基因的研究多是采用针对预选基因(Candidate Gene Study)的病例-对照研究,根据基因的功能预设可能的目标基因,采用PCR-RFLP法、PCR-SSCP技术、Taqman探针法等实验技术。这些方法费用相对较低,但是检测覆盖的基因数量较少。近年来使用全基因组关联研究(Genome-wide Association Studies, GWAS)的方法对肝癌易感基因进行研究,使用的基因芯片能在全基因组范围内同时检测几十万至上百万个单核苷酸多态性(Single nucleotide polymorphisms SNP)位点的变异情况,覆盖几十万个基因,因而使得发现更多超出人们预料的易感基因成为可能。本研究先全面检索了Embase、Pubmed和BIOSIS Preview文献数据库,收集所有肝癌易感相关基因研究,通过文献计量学的方法分析肝癌易感相关基因的研究状况,然后汇总所有有文献支持的易感相关基因,进行生物信息学分析,对众多易感相关基因进行生物功能学解释,寻找其中对肝癌发病起关键影响的基因。方法:1.文献收集与分析:从Embase、Pubmed和BIOSIS Preview数据库中检索2001年1月-2014年1月肝癌易感性相关基因研究的原始研究文献。基于文献挖掘的方法统计肝癌易感相关基因。另外,随着肝癌易感相关基因的原始研究逐渐增多,相关的META研究也逐渐增加,本研究还进一步汇总分析了截止2015年1月31日以来该领域发表的META研究文献。2.基因生物信息学分析:汇总文献中的肝癌易感相关基因,通过基因名称转换工具Clone/GenelD Converter和Pubmed中的Gene数据库将基因名称转换为统一的官方名称。利用在线GATHER软件将所有的肝癌易感性相关基因进行GO分类和KEGG通路分析。另外,将统计所得肝癌易感相关基因上传至在线STRING 9.1软件构建由导入基因所表达产物组成的蛋白质相互作用网络。将在线STRING 9.1软件中所得网络数据导入Cytoscape 3.0.2软件,将相应网络进一步可视化处理,同时利用其插件CentiScape 2.1,计算网络及各个节点的拓扑特性,并筛选出关键节点。结果:1.文献计量学研究结果Embase数据库检出文献3362篇, Pubmed/Medline数据库检出文献1297篇,BIOSIS Previews检出文献3902篇,合并3数据库检索结果,去重并按照纳入标准进一步筛选,最终纳入原始研究文献708篇,大部分基因只有1-3篇研究文献支持。截止至2015年1月31日,总共有61篇META,这些META分析使用了708篇原始研究文献中的研究。研究者大部分为中国人。34个基因进行了META分析研究,分别是:CYP1A1 CYP2E1 EGF EPHX1 ERCC2 GSTM1 GSTP1 GSTT1 HFE HLA-DQ HLA-DQB1 HLA-DRB1 IFNL3 IL10 IL1B IL6 KIF1B MDM2 MIR146A MIR196A2 MIR499A MTHFR NAT2 OGG1 PNPLA3 PTGS2 SOD2 STAT4 TGFB1 TNF TP53 UGT1A7 XRCC1 XRCC3。另外,该领域至今已经发表的GWAS研究有7个,发现的相关基因和SNP位点如下:2.基因生物信息学分析文献涉及201个肝癌易感相关基因,不同分级的GO分类741种,其中ln(贝叶斯因子)大于10且P值0.001的分类有32种,显示这些基因主要与细胞损伤修复、免疫反应、细胞周期调节、炎症反应、DNA损伤修复、凋亡、抗原递呈等有关。KEGG通路66种,其中ln大于0的通路有8种。主要是参与细胞受体信号传导通路、细胞周期调节、毒物降解、氨基酸、脂肪酸代谢。基因相关蛋白相互作用网络分析,筛选出11个关键基因:TP53、IL6、TGFB1、TNF、ESR1、 VEGFA、HIFIA、STAT1、IFNG、SOD2、CTNNB1。结论:1.国内外对肝癌易感相关基因的研究越来越多,研究机构主要集中在东亚、地中海周边这些肝癌高发地区。该领域的META分析也迅速增加,主要是中国研究者进行的META分析。2.大部分研究结论缺乏足够的验证,不管是GWAS研究还是预选基因研究都有其优缺点,需要在更多大样本、不同种族不同遗传背景的研究中进行验证。3.肝癌易感性相关基因GO分类及KEGG通路分析发现易感相关基因主要集中于:应激反应、炎症与免疫反应、DNA修复、细胞周期调控、解毒能力等基因集。4.从众多的肝癌易感相关基因中发现了11个关键节点基因,由于其所具有的重要功能位置,值得后续进一步研究。第二部分 肝癌基因表达谱生物信息学分析研究背景和目的肝癌发病机制及治疗一直是个研究热点,但是相对于其他一些癌症,肝癌的治疗进展相对比较缓慢。肝癌患者诊断的时候多数已经处于肿瘤晚期,手术根治的机会往往较小,而化疗一直有效率不高,近年出现的以索拉非尼为代表的靶向治疗为肝癌的生物靶向治疗开辟了新的道路,但是索拉非尼的临床有效率也不高,长期用药后会面临耐药。索拉非尼以外的其他分子靶向药物的研究虽然很多,但效果却不理想。对肝癌发病及进展的分子机制进行深入的研究,寻找合适的分子靶点就成为改善肝癌疗效的迫切需要。肝癌的形成过程就象很多其他的肿瘤,会经历一个从癌前病变、低度恶性到高度恶性病变这样的演变过程,典型的肝癌大部分会经历肝炎、肝硬化、不典型增生结节、肝癌这样一个发展演进过程。由于基因的不稳定性,在这个过程中会不断出现基因序列突变和表观遗传学改变,这些基因层面的改变都会导致转录组层面的基因表达异常,并进而改变细胞的功能,造成细胞恶性程度的不断演进。出现功能异常的基因很多,包括促进细胞增殖、抗凋亡、促进浸润、转移、血管生成、干细胞特性、肿瘤细胞能量代谢方式改变等方面的基因。另外还包括很多对细胞功能影响较小的基因改变,不同的致病原因导致的基因改变也不完全相同,但是会有类似的病理过程,因此可能存在共同的分子病理学改变,存在共同的激活通路和异常基因。本研究就是通过纳入各种病因背景的肝癌基因表达谱来寻找其中的共同分子改变。肝癌组织中出现的表达异常基因众多,如何找到其中的关键基因,以往的研究多数是针对单个基因,通过病例-对照方法研究某个基因与临床表型的关系。但是,癌症的发生发展同时涉及多个基因的功能改变,这些基因不是各自单独行使功能,它们往往是处于各种调控通路内,通过影响整个通路的功能状态来改变细胞的功能。在生物学过程中,某条通路中多个基因表达的轻微改变并导致的整条通路的功能变化,其生物学意义显然远远高于单个基因的表达倍数改变。另外,由于很多基因同时调控多个通路,很多通路之间存在复杂的交叉网络联系。近来,系统生物学的方法已经被越来越多的应用到基因组的数据分析中,它是以基因或蛋白质作为节点,以信号通路或生物过程基因集而非单个基因为考察对象,通过构建相互作用模型,从基因的相互作用分析中得到比单个节点分析更多的信息。因此,可以通过基因表达产物相互作用关系构建相互作用网络模型,分析寻找网络中的关键节点,这些关键节点对于某种异常状态的细胞整体功能的维持有重要意义。通路分析结合相互作用网络分析的方法可以找到那些表达变化不甚显著,但是在整个通路中处于重要功能位置的基因,这些基因的轻度变化可能对下游的众多基因功能产生显著影响,这类基因在既往单纯依靠单个基因表达水平来寻找目标基因的分析方式中难以被发现。表达谱芯片可以同时研究组织的数万个基因的表达情况,在全基因组层面对细胞的基因表达的变化进行全面比较,寻找与肿瘤的功能变化相关的各种基因。美国国立卫生研究院生物信息中心基因芯片数据库(GEO)是当今最大、最全面的公共基因表达谱数据库,至今已经收集了100多万样本的表达谱原始数据,对数据从不同的角度进行再分析,可以让这些数据获得更大的使用价值,也可以减少不要的重复研究。为了发现对维持肝癌细胞异常功能起关键作用的基因,本研究将从GEO数据库下载的肝硬化、不典型增生结节和肝癌组织表达谱芯片分别与正常肝组织表达谱芯片进行对比,寻找差异表达基因,然后通过通路分析的方法筛选出肝癌特有的异常通路。另外通过提取差异通路中的基因,进行基因产物蛋白相互作用的分析,找到维持这些通路关键的节点基因。材料与方法:1.1从GEO数据库检索下载人类的正常肝组织、肝硬化组织、肝脏不典型增生结节组织、肝癌组织的表达谱数据,芯片选择GPL570([HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0)。1.2芯片数据的分析数据分析采用BRB-Array Tools软件4.4.0-Beta_1版本。R version 3.0.2, hgu133plus2.db (Version:2.10.1)。将肝硬化组织、不典型增生结节肝组织、肝癌组织的表达谱分别与正常肝组织表达谱进行对比分析,寻找差异表达基因并分析。1.3蛋白质相互作用网络构建将KEGG和Biocarta通路分析显示有显著性差异的通路中的表达差异基因上传至在线STRING 9.1软件构建由导入基因表达产物组成的蛋白质相互作用网络。1.4网络可视化及关键基因的筛选将在线STRING 9.1软件中所得相互作用网络数据导入Cytoscape 3.1.1软件,将相应网络进一步可视化处理,同时利用其插件CentiScaPe 2.1,计算网络及各个节点的拓扑特性,并筛选出关键节点。结果:根据纳入标准从GEO数据库纳入分析的数据集11个,共计纳入正常肝组织芯片39例,肝硬化组织芯片33例,不典型增生结节组织芯片17例,各期肝癌组织芯片286例。对差异表达基因进行GO分类、KEGG和Biocarta通路分析,显示肝硬化组织、不典型增生结节组织和肝癌组织的显著差异基因集基本没有重叠,显示三者间基因表达谱差异性显著。肝癌基因表达谱差异基因的GO分类主要集中于:细胞周期的转录调控、DNA的复制、氨基酸的代谢、有丝分裂的调节,这些均与肿瘤细胞的高生长状态有关。KEGG通路分析显示显著富集通路集中于能量代谢、氨基酸代谢、DNA的复制、叶酸一碳单位库、药物与毒物代谢相关酶代谢通路,其中表达水平升高的通路有:hsa00670(叶酸的一碳代谢库)、hsa03030(DNA的复制通路)、hsa04966(集合管酸分泌通路)、hsa05410(肥厚型心肌病通路)。Biocarta通路富集于细胞周期调控、DNA损伤与修复等通路。根据通路基因上下调计数,高表达的富集通路有:h_vdrPathway(维生素D受体调控的基因表达通路)、h_g2Pathway(细胞周期中G2/M期检查点通路)、h_ptc1 Pathway (Sonic Hedgehog受体Ptcl调节的细胞周期通路)、h_cdc25Pathway (DNA损伤应答中的cdc25和chkl调控通路)、h_antisensePathway (RNA聚合酶Ⅲ转录通路)、h_atrbrcaPathway (BRCA1、BRCA2、ATR相关肿瘤易感性通路)、h_mcmPathway (DNA复制中的CDK调控通路)、h_stathminPathway(微管解聚蛋白Stathmin与乳腺癌抗微管药耐药通路)、h_rbPathway (DNA损伤应答的RB瘤抑制/检验点通路)、h_smPathway(剪接体的组装通路)、h_ckl Pathway(1型谷氨酸受体调节的Ckl/cdk5通路)、h_rac1 Pathway (Rac 1细胞运动的信号转导通路)、h_EfpPathway(雌激素反应蛋白Efp控制的细胞周期和乳腺癌生长通路)、h_cellcyclePathway(细胞周期蛋白和细胞周期的调控通路)。低表达的通路有:h_nuclearRsPathway(脂代谢和解毒相关核受体通路)、h_lectinPathway(凝集素诱导的补体途径X_hcompPathway(补体通路)、h_ghrelinPathway(生长激素释放肽通路:调节食物摄入量与能量平衡)。由于肝癌组表达谱差异基因的富集通路为不同于肝硬化和不典型增生结节的特有基因集,将肝癌芯片的KEGG和Biocarta通路分析显示有显著性差异的基因依序导入STRING、Cytoscape并分析后找到43个节点基因:CYP2C19、 ESR1、CYP2A6、CYP3A4、IGF1、FTCD、GSTA3、CYP2B6、PLG、CAT、HADH、 KNG1、F2、GOT2、PPARA、PKLR、SERPINC1、MDH2、PTGS2、POLE、SHMT2、 GOT1、CCND1、MDH1、CREBBP、CYP3A5、DHFR、SERPINE1、PPARG、 GSTA4、TP53、CDK2、CAD、GAPDH、ATIC、POLA1、PCNA、RFC4、POLD1、 TYMS、TGFB1、CDK1、PKM2经过比对NCG 4.0数据库,发现上述基因中ATIC、CCND1、CREBBP、FTCD、 MDH2、PPARG、TP53属于多种肿瘤的驱动基因。结论:本研究通过对比肝硬化、不典型增生结节和肝癌3种病理状态下的差异表达基因的GO分类和通路,显示它们之间基本无重叠,显示这3种状态下的基因表达谱变化不是递进式的积累,各自代表了不同的分子功能状态。后续基因生物信息学分析纳入的肝癌通路中的基因整体可以代表肝癌特有的病理分子状态。通过肝癌基因表达谱芯片的生物信息学分析,发现了与肝癌发生发展有关的一批功能基因集和一批对于维持肝癌特有生物功能的分子网络有重要作用的关键基因,这些基因经过进一步研究后可能成为肝癌靶向治疗的分子靶点。另外,本研究从通路与功能基因集的角度来分析差异表达基因数据,能够从全局的角度分析基因表达谱组学数据,这比单纯从单个基因的角度分析差异基因能更好的了解肿瘤细胞功能的改变,这种方法以后可以用于更多肝癌数据及其它疾病基因表达谱数据的分析。
【图文】:
逦第一部分肝癌易感相关基因及生物信息学分析逦逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
逦第一部分肝癌易感相关基因及生物信息学分析逦逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
【学位授予单位】:南方医科大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:R735.7
,
本文编号:2546330
【图文】:
逦第一部分肝癌易感相关基因及生物信息学分析逦逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
逦第一部分肝癌易感相关基因及生物信息学分析逦逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
【学位授予单位】:南方医科大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:R735.7
,
本文编号:2546330
本文链接:https://www.wllwen.com/yixuelunwen/zlx/2546330.html