低频遗传变异与肺癌遗传易感性及预后关联研究
发布时间:2018-02-12 09:28
本文关键词: 肺癌 低频遗传变异 遗传易感性 预后 全外显子组关联研究 出处:《南京医科大学》2017年博士论文 论文类型:学位论文
【摘要】:肺癌是全球最常见的恶性肿瘤之一。目前其发病率和死亡率均位居全球范围内恶性肿瘤的首位。近年来,肺癌持续占据我国男性新发恶性肿瘤的首位,女性新发恶性肿瘤的第二位;而且由于肺癌预后差,在我国全肿瘤死因中,肺癌始终占据首位。过去数十年中,持续增长的烟草消费和不断加重的环境污染,导致我国多数地区的肺癌发病率和死亡率仍呈现不断上升趋势,肺癌是严重危害我国居民健康和生命的重要公共卫生问题之一。流行病学研究表明,肺癌的发生是环境因素和遗传因素共同作用的结果。尽管80%以上的男性肺癌和至少50%的女性肺癌可归咎于烟草暴露,但在相同的烟草暴露下,仅不到20%的吸烟者最终发展为肺癌,提示遗传因素在肺癌发生中起重要作用。临床分期和组织病理类型是判断患者预后的主要临床指标,但临床分期和组织病理类型相同的个体接受同样的治疗方案,治疗效果往往差异很大,提示不同的肺癌患者对治疗敏感性的情况不同,个体的遗传背景可能会影响患者的临床预后。因此,筛选有效的遗传标志物用于肺癌高危人群的鉴定,指导肺癌个体化预防,预测肺癌患者预后,指导肺癌的个体化治疗,是目前国内外研究的热点。近年来,随着人类对基因组认识的不断深入,以及高通量技术平台的建立和完善,全基因组关联研究(Genome-wide association studies,GWAS)已经成为探索复杂疾病遗传易感性和筛选预后遗传标志物的有力工具。该策略能快速筛查全基因组范围内的常见遗传标志,通过大样本量的初筛和后期多个独立研究的验证,研究结果往往具有较高的重现性和可靠性。本课题组前期开展了首个中国汉族人群肺癌GWAS研究,研究结果不仅验证了前期报道的肺癌易感区域(3q28和5P15.33区域等),还发现了一批新的中国汉族人群肺癌易感区域(5q32、10p14、13q12.12、20q13.2 和 22q12.2 区域)。在肺癌预后的 GWAS 研究中,我们发现 3p22.1、4q26、5p14.1、7q31.31、9p21.3 和 14q24.3 区域的遗传变异可能与肺癌患者的生存时间显著相关。肺癌易感性及预后的GWAS研究,较系统地揭示了常见遗传变异与肺癌易感性及预后的关系,为肺癌的病因学研究、预后疗效评估和治疗靶标筛选提供了非常有价值的线索。然而,既往的GWAS研究策略是基于"常见疾病/常见变异"的遗传假说,因此早期GWAS芯片通常利用单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的连锁不平衡(linkage disequilibrium,LD)原理,通过标签SNP代表整个基因组的常见遗传变异(较小等位基因频率,MAF≥5%),难以对低频遗传变异进行系统研究。常见变异频率较高但外显性较低,目前发现的常见遗传变异仅能解释部分的遗传性状,至今尚存在大量的"遗传性丢失"。近年来,研究者提出了"常见疾病/低频变异"的假说,认为低频变异(MAF5%)往往具有较高的外显性,对常见疾病或性状的贡献同样重要,可能解释部分的"遗传性丢失"。高通量测序是低频遗传变异关联研究最理想的策略,但高昂的价格限制了该方案的广泛应用。为了提供系统探索低频遗传变异关联研究的可行技术平台,Illumina公司基于12031个个体的全基因组测序和外显子测序数据,系统筛选了不同人种(包括亚洲人、欧洲人、非裔美国人和西班牙人),不同疾病(如2型糖尿病、癌症、代谢及精神疾病等)相关基因的约240000个遗传变异,推出了一款高通量芯片-Infinium(?)HumanExome Beadchip。该芯片的93.1%位点位于外显子区,其余位点位于启动子区、终止密码子区、剪接区等,其中89.5%的位点为低频遗传变异。因此,为了探索低频单核苷酸遗传变异(Single Nucleotide Variant,SNV)在肺癌发生发展中的作用,本研究采用"外显子组芯片(Infinium(?)HumanExome Beadchip)"的分型技术,基于大样本多阶段的病例-对照研究设计,研究低频遗传变异与中国人群肺癌发生风险的关联;在此基础上,我们进一步整合肺癌患者临床和预后信息,探讨低频遗传变异对肺癌患者预后的影响。本研究结果对于进一步发现中国人群的肺癌遗传标志物,提高肺癌风险预测效能,深入理解肺癌的预后差异机制,促进个体化治疗具有重要的理论和现实意义。第一部分低频遗传变异与肺癌遗传易感性关联研究肺癌GWAS研究发现的超过30个肺癌易感位点(区域),仅能解释不到1%的肺癌遗传度,目前尚存在大量未知的遗传缺失有待进一步挖掘。传统GWAS研究通常只关注常见遗传变异,而忽略了低频遗传变异的贡献。而近期,Wang等人整合前期欧美人群的多项肺癌GWAS研究,按照统一的质控和填补流程进行了全基因组整合分析,最终发现了 2个低频错义位点BRCA2(p.Lys3326X,MAF=0.009,OR=2.47,P= 4.74 × 10-20)和CHEK2(p.Ile157Thr,MAF=0.007,OR=0.38,P=1.27×10-13)与肺鳞癌易感性显著相关,且效应远大于既往发现的常见遗传变异,该研究证明了外显子区低频遗传变异在肺癌易感性中的重要作用。然而,目前尚无低频遗传变异与中国汉族人群肺癌遗传易感性研究的报道,因此我们开展了首个中国人群肺癌全外显子组关联研究。本研究采用大样本多阶段的病例-对照研究设计,在初筛阶段采用Illumina HumanExome Beadchip芯片对1348例肺癌病例和1988例健康对照进行基因分型。然后我们进行了系统的质量控制,剔除质量不合格的样本(包括分型成功率低、存在亲缘关系、存在明显人群分层以及与前期GWAS芯片分型不一致)和位点(包括线粒体和性染色体位点、重复位点、分型成功率不合格位点、偏离Hardy-Weinberg位点以及频率为0的位点),最终1341例肺癌病例和1982例健康对照的72423个位点纳入后续关联分析。针对关联分析结果,我们筛选P1×10-3且分型可靠的低频错义或剪切位点,在4699例肺癌病例和4915例健康对照中进行了两阶段验证。对验证一致的遗传变异,我们采用单纯病例研究设计,评价了这些遗传变异对于肺癌发病年龄的影响。基于低频错义和剪切位点,我们开展了基因水平的关联分析。最后,基于The Cancer Genome Atlas(TCGA)数据库,我们进一步评价了易感基因在肺癌发生中的潜在作用。研究结果显示,位于BAT2,FKBPL和BPIFB1上的3个低频错义遗传变异与肺癌发生风险显著相关:rs9469031(6p21.33,BAT2 c.1544CT[p.Pro515Leu];OR=0.55,P=1.28×10-10);rs200847762(6p21.33,FKBPL c.410CT[p.Pro137Leu];OR=0.25,P=9.79× 1012)和 rs6141383(20q1 1.21,BPIFB1c.850GA[p.Val284Met];OR=1.72,P=1.79×10-7)。在单纯病例分析中,我们发现 rs9469031-C(P=0.001)和rs6141383-A(P=0.006)与肺癌的早发显著相关。基因水平关联分析提示FKBPL可能是6p21.33区域肺癌易感性的关键基因(SKAT-O检验:P=1.29×10-9;Burden检验:P=2.00×10-10)。基于TCGA基因表达数据库,我们发现BAT2,FKBPL和BPIFB1在肺癌与癌旁组织中均显著差异表达。上述结果表明,6p21.33和20q11.21区域的低频遗传变异可能与中国汉族人群肺癌的易感性相关,低频遗传变异在肺癌发生中可能发挥重要作用。我们的研究进一步完善了中国人群的遗传易感图谱,研究结果对深入理解肺癌的发生机制、指导高危人群筛查和个体化预防有重要的理论意义和潜在应用价值。第二部分低频遗传变异与肺癌预后关联研究基于GWAS的研究策略,前期多项研究系统探讨了常见遗传变异与中国汉族人群肺癌预后的关联,发现了一批影响中国汉族人群肺癌预后的关键区域,包括染色体 2p23、2q22、2q34、3p22、5p14、6p21、7q31、9p21、9p22、11q22、12q23、13q33、14q24、15q21、16q21、19p13 和 21q22 等。然而前期研究主要关注常见遗传变异,低频遗传变异与肺癌预后关联尚不清楚。因此,我们基于课题组前期积累,进一步整合肺癌患者的临床和预后信息,开展了肺癌预后的全外显子组关联研究。本研究采用单纯病例研究设计。在前述应用Illumina HumanExome Beadchip芯片芯片完成检测的1348例肺癌患者中,1008例具有完整临床资料和预后随访信息的肺癌样本纳入本研究。经过系统的质量控制后,共1001例肺癌病例的57903个位点纳入后续关联分析,关联分析使用Cox回归模型。对于初筛阶段满足P1×10-3且分型可靠的低频错义或剪切位点,我们进一步在773例同时具有临床随访、基因型及表达信息的TCGA肺癌样本中进行了验证。首先,我们使用SHAPE和IMPUTE2软件进行了全基因组填补,由于填补后的TCGA数据仅能得到部分低频位点的基因型信息,而低频错义或剪切位点往往只影响本体基因的功能,因此我们同时使用基因的表达水平与肺癌预后的关联作为我们研究结果的进一步佐证。对TCGA填补后的基因型和表达数据,我们使用Cox模型计算了其与肺癌预后的关联。对于TCGA基因型或表达验证一致的位点,均作为本研究的显著关联位点。基于低频错义和剪切位点,我们使用R包'coxKM'进行了基因水平的关联分析,并根据计算得到的P值使用R包'ARTP'开展了通路分析。研究发现,2p23.2区域的低频错义位点rs117512489(PLB1[p.Arg1131Gln])与肺癌预后显著相关(HR=2.02,P=7.28×10-4),且TCGA数据库中其表达水平与肺癌预后相关(HR=1.15,P=0.023)。此外,我们还发现7p11.2区域的低频错义位点 rs33922584(CCT6Ap.Tyr229Cys])与肺癌预后显著相关(HR=1.75,P=6.06×10-4),在TCGA数据库中,其基因型(HR=4.19,P=0.015)和表达水平(HR=1.15,P=0.047)均与肺癌预后相关。进一步分析发现,rs33922584可能损害CCT6A蛋白的结构和磷酸化,且在TCGA的肺癌样本中rs33922584与CCT6A的表达水平显著相关(p=0.019)。差异表达分析发现,CCT6A在肺癌的癌组织中显著高表达(P=3.75×10-28)。在基因水平的关联分析中,我们发现了包括CCT64在内的32个肺癌预后相关基因,通路分析提示包括CTNNB1相关通路,细胞周期G2-M通路在内的多条通路可能与肺癌的预后相关。经过两阶段研究,我们最终发现2p23.2和7p11.2区域的两个低频错义位点与肺癌预后显著相关,且其基因型或(和)表达水平在TCGA数据库中关联一致。同时,研究还提示了一批新的可能影响肺癌患者预后的关键基因和通路。本研究结果对深入理解肺癌的预后机制,促进肺癌个体化治疗,新靶标的研发具有重要的指导意义和潜在应用价值。
[Abstract]:......
【学位授予单位】:南京医科大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:R734.2
【参考文献】
相关期刊论文 前2条
1 朱猛;程阳;戴俊程;谢兰;靳光付;马红霞;胡志斌;师咏勇;林东昕;沈洪兵;;基于全基因组关联研究的中国人群肺癌风险预测模型[J];中华流行病学杂志;2015年10期
2 JASON HSIA;SAMIRA ASMA;;Methodology of the Global Adult Tobacco Survey in China, 2010[J];Biomedical and Environmental Sciences;2010年06期
,本文编号:1505311
本文链接:https://www.wllwen.com/yixuelunwen/zlx/1505311.html