全基因组通路分析策略应用于皮肤基底细胞癌易感性的关联研究
发布时间:2018-12-14 23:53
【摘要】:肿瘤是一种复杂疾病,除了传统的流行病学易感因素外,越来越多的研究表明,个体遗传易感性在肿瘤的发生发展中起重要作用。以往的肿瘤分子流行病学通常采用候选基因和通路的选点策略逐一检测可疑基因和生物学通路中的单核苷酸多态(SNP)与肿瘤风险的关联。近年来,随着高通量基因分型技术的成熟和成本的降低,全基因组关联研究(GWAS)被广泛应用。随着大规模、高密度的全基因组关联研究在肿瘤病因学研究中的推进,许多新的肿瘤易感位点被逐步发现。分子流行病学在方法学上的革命改进了我们对包括癌症在内的多种疾病的遗传基础的认识。 全基因组关联研究在发掘新的肿瘤易感基因和位点上取得了巨大成功;然而,该方法仅关注严格符合全基因组显著性水平的少数位点,大量起着微小效应的遗传变异被忽略。鉴于许多疾病的易感基因往往在功能上存在相关性或共同作用于同一生物学通路,以通路为基础的研究方法被发展起来。该方法通过评估功能相关或处于同一生物学通路中的多个基因的共同作用,,有助于发现富集多个微效基因的特定生物学通路与疾病的关联。传统的通路分析方法简单地将基因区域内的SNPs分配到基因,这种策略有一定的局限性。首先,基因区域的许多SNP并无功能,将基因区域内的所有SNP纳入大大增加冗余的多重检验。其次,位于某个结构基因的SNP可能对另一基因起表达调控作用,这样的SNP可能被错误的分配到与其功能无关的结构基因。目前,随着高通量的基因表达分析和基因分型技术的进步,全基因组基因表达的关联研究已广泛展开。数以千计与基因表达相关联的基因表达数量性状位点(eQTLs)被发现。将这些eQTLs功能性分配到其所调节的基因有助于减少大量的假阳性信号并发现真正富集了疾病相关功能性多态的生物学通路。因此,将eQTL信息和肿瘤全基因组关联研究相整合的通路分析方法可能有助于更好的诠释全基因组关联数据。基于如上对全基因组关联研究的思考,我们展开了如下研究:(1)应用传统通路分析策略进一步分析皮肤基底细胞癌(BCC)的全基因组关联研究数据,以挖掘BCC GWAS数据中潜藏的遗传信息并寻找疾病相关生物学通路;(2)将全基因组基因表达的关联研究数据和皮肤基底细胞癌的全基因组关联研究数据相整合,对基因表达相关位点采用通路分析策略研究其与皮肤基底细胞癌易感性的关联。 综上所述,本研究采用通路分析策略对皮肤基底细胞癌全基因组关联研究数据进行了进一步的分析和探索。后全基因组时代的通路分析策略以及新兴的整合全基因组基因表达关联研究的通路分析策略在皮肤基底细胞癌的应用有助于发现新的皮肤基底细胞癌致病通路。该方法能结合现有生物学知识并充分利用全基因组关联研究数据中大量遗传信息,对其他肿瘤全基因组关联研究数据的挖掘具有借鉴价值。 第一部分传统全基因组通路分析策略应用于皮肤基底细胞癌易感性的关联研究 尽管全基因组关联研究的应用成功地发现了许多新的肿瘤易感基因和位点,但是,严格符合统计学“全基因组”显著性水平的往往只有极少数的几个SNPs,其通常只能解释一小部分的遗传易感性。全基因组关联数据中还存在大量的剩余遗传信息有待发掘,这些剩余的遗传信息可能会为我们对肿瘤的遗传易感性提供一个更深刻的认识。新兴的全基因组通路分析方法通过评估同一生物学通路和网络中的多个基因对肿瘤发生的累积效应,可能有助于发掘富集多个微效基因的相关生物学通路,在更大程度上利用全基因组关联研究数据。若干复杂疾病的全基因组关联研究已经采用全基因组通路分析方法发现了一些新的疾病易感生物学通路。在这项研究中,我们将通路分析的策略应用于皮肤基底细胞癌的全基因组关联研究。我们首先在高加索人群中的1797例皮肤基底细胞癌病例和5197例无癌对照中对740760个基因分型的SNPs进行全基因组关联研究。其中,115688个在基因上下游20KB范围内的SNPs被分配到临近的基因。随后,我们将这些基因归入174条KEGG数据库中的生物学通路和205条BioCarta数据库中的生物学通路,并建立了两个阳性对照通路——色素沉着通路和已知BCC风险相关基因通路。我们采用加权Kolmogorov-Smirnov检验对每个通路进行基底细胞癌风险的相关性评估,并通过1000次置换计算显著性水平。 结果显示,两条阳性对照通路均达到P 0.05的显著性水平。此外,其他四条通路也显示与BCC发病风险存在显著关联。这四条通路分别是:硫酸肝素合成通路(P=0.007;假阳性报告率,FDR=0.35),mCalpain通路(P=0.002,FDR=0.12),Rho细胞运动信号转导通路(P=0.01,FDR=0.30)以及一氧化氮合成通路(P=0.02,FDR=0.42)。 通过采用通路分析的策略进一步分析BCC GWAS数据,我们验证了两条已知的BCC风险相关通路,并新发现了四条生物学通路与BCC发病风险显著相关。这四条生物学通路的发现可能为BCC的病因学提供新的见解。此外,该方法在肿瘤全基因组关联研究中的应用可能有助于我们发现传统全基因组关联研究方法可能遗漏的遗传信息。 第二部分全基因组基因表达关联研究与通路分析结合的策略应用于皮肤基底细胞癌易感性的关联研究 传统的全基因组通路分析方法从基因所在区域选取该基因的代表性SNP。然而,基因区域中的大量SNPs并无功能;此外,基因远处的遗传变异可能反式监管基因表达。因此,整合全基因组基因表达关联数据和全基因组疾病关联数据的新的通路分析策略被提出。该方法将有助于筛选功能性多态,减少大量的假阳性信号并将真正的疾病相关信息富集于生物学通路。现有研究显示,肝脏和脂肪组织基因表达相关的SNPs富集了2型糖尿病的易感位点,而整合了肝脏和脂肪组织全基因组基因表达数据和2型糖尿病全基因组关联研究数据的新的通路分析方法成功检测出了若干已知的2型糖尿病相关生物学通路并发现了一些新的生物学通路与疾病风险显著相关。此研究为2型糖尿病的病因学研究提供了新的见解。 在这项研究中,我们将两个现有的数据库中基因表达的数量性状位点信息和皮肤基底细胞癌的全基因组关联研究数据相整合,采用新的通路分析策略分析皮肤基底细胞癌的全基因组关联数据。我们首先用两个EB病毒转染的淋巴母细胞系(LCL,n=995)的全基因组基因表达关联研究,确定322324个表达相关的SNPs(eSNPs)并在高加索人群2045例BCC病例和6013个无癌对照中检验其与BCC发病风险的关联。随后,我们将这些eSNPs对应到其调控的基因并将这些基因归入99条KEGG数据库中的生物学通路进行通路分析。具体通路分析方法同第一节。结果,我们发现了两条生物学通路与BCC相关(P 0.05,FDR 0.5)。这两条通路为:自身免疫性甲状腺疾病通路(主要为HLA I类和II抗原,P 0.001,FDR=0.24)和JAK-STAT信号通路(P=0.02, FDR=0.49).其中,JAK-STAT信号通路中的307个与BCC显著相关的eSNPs中有79个(25.7%)在一个独立的包含278例BCC病例和1262名对照的验证人群中被证实与BCC相关(P 0.05)。此外,我们采用16691个由110例正常皮肤样本全基因组基因表达关联研究确定的eSNPs对这两条通路进行通路分析的验证,JAK-STAT信号通路提示一定的关联(P=0.08)。基于JAK-STAT信号通路在肿瘤发生中的生物学功能的证据,该通路很可能在BCC的病理机制中起关键作用。 通过整合全基因组基因表达关联数据和BCC全基因组关联研究数据,我们将eSNPs功能性定位到相关基因并进行了BCC全基因组通路分析。本研究发现了JAK-STAT信号通路与BCC发病风险相关并进行了验证。该通路分析策略结合了SNPs的功能学信息,对全基因组关联研究数据进行了更有效的利用。该方法的应用可能有助于我们进一步探索全基因组数据中的遗传信息并发现新的疾病易感通路。
[Abstract]:......
【学位授予单位】:南京医科大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:R739.5
本文编号:2379539
[Abstract]:......
【学位授予单位】:南京医科大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:R739.5
【共引文献】
相关博士学位论文 前1条
1 谭雪晶;在皮肤炎症反应和细胞凋亡中一氧化氮及复方甘草酸苷的调节作用[D];大连医科大学;2011年
本文编号:2379539
本文链接:https://www.wllwen.com/yixuelunwen/pifb/2379539.html
最近更新
教材专著