基于家系数据的遗传印记效应检验及合并遗传印记效应的关联分析方法研究
发布时间:2018-03-03 02:30
本文选题:数量性状 切入点:质量性状 出处:《南方医科大学》2014年硕士论文 论文类型:学位论文
【摘要】:背景: 遗传印记是子代某些特定的等位基因,由于来自性别不同的亲本而导致其表现型出现差异的一种遗传现象,它在复杂疾病的研究中扮演重要角色。对于人类的一个二等位基因标记位点,当核心家庭中个体的基因型无缺失时,Q-PAT(c)(parental-asymmetry test with any constant c for quantitative trait,数量性状的亲代不对称检验,c为任意常数),是一种简单高效的数量性状遗传印记效应检验方法。当核心家庭数据只有单亲的信息时,Q-1-PAT(c)可用于印记效应的检验。对于只有单亲信息的家庭数据以及双亲信息都有的家庭数据的混合数据类型,Q-C-PAT(c)可用于合并这两类数据并计算整体的统计量对遗传印记效应进行检验。然而,虽然Q-C-PAT(c)是简单而高效的遗传印记效应检验方法,但其仅仅适用于只有两代人的核心家庭而不适用于广义家系数据,因而浪费了大量有用的信息,最终降低其检验效能。另一方面,PPAT (pedigree parental-asymmetry test,基于家系数据的亲代不对称检验)和MCPPAT (Monte Carlo pedigree parental-asymmetry test,基于家系数据的蒙特卡罗亲代不对称检验)方法可用于家系数据的遗传印记检验。但是,这两种检验方法只能用于质量性状位点的遗传印记检验,不适用于数量性状位点的遗传印记检验。 近年来,关联分析已经被广泛应用于质量性状疾病致病位点的定位研究。越来越多的研究表明,如果遗传印记效应存在,合并遗传印记效应的信息之后,关联分析的检验效能会得到提升。对于二等位基因标记位点,基于家系数据的PDT (pedigree disequilibrium test,家系不平衡检验)和其扩展的可处理缺失数据的MCPDT (Monte Carlo pedigree disequilibrium test,蒙特卡罗家系不平衡检验)方法是高效的关联分析方法。然而,它们在进行关联分析时,并不考虑遗传印记效应的影响。当遗传印记效应存在时,这种做法会降低其检验效能。另一方面,合并遗传印记效应的传递不平衡检验TDT*虽然可以将遗传印记效应合并到关联分析中,但是它只适用于两代人的核心家庭,并不适用于广义家系数据。 方法: (1)对于无基因型缺失的家系数据,我们提出了Q-PPAT(c)(pedigree parental-asymmetry test with any constant c for quantitative trait,带有任意常数c的数量性状家系亲代不对称检验)以检验数量性状位点的遗传印记效应。Q-PPAT(c)利用每个家系中所有的两代人核心家庭数据来计算统计量。当家系数据的基因型有缺失时,我们提出了Q-MCPPAT(c)(Monte Carlo pedigree parental-asymmetry test with any constant c for quantitative trait,带有任意常数c的数量性状蒙特卡罗家系亲代不对称检验)来检验印记效应。该方法根据给定的或者由奠基者的基因型估计的等位基因频率,通过使用Monte Carlo模拟与估计的方法来对大量缺失的信息进行反推。 (2)对于无基因型缺失的家系数据,我们首先用PPAT方法检验遗传印记效应。然后,根据检验结果,从PDTp (paternal version of PDT,基于杂合子父亲的PDT), PDT和PDTm (maternal version of PDT,基于杂合子母亲的PDT)中选择一个最合适的统计量作为关联分析的检验统计量。然而,当个体的基因型有缺失时,在第一阶段,我们首先用MCPPAT来检测遗传印记效应,然后再从MCPDTp (paternal version of MCPDT,基于杂合子父亲的MCPDT), MCPDT和MCPDTm (maternal version of MCPDT,基于杂合子母亲的MCPDT)中选择一个最合适的统计量来检验关联。 结果: (1)基于不同样本量、基因型缺失率、遗传印记效应和人群模型,作者进行了模拟研究以评价所提出的方法的表现。结果表明,在遗传印记不存在的原假设下,Q-PPAT(c)以及Q-MCPPAT(c)皆可以较好地控制犯第Ⅰ类错误的概率。另一方面,检验效能的比较表明,Q-PPAT(c)和Q-MCPPAT(c)的检验效能都比只使用两代人核心家庭数据的Q-PAT(c)要高。而且,Q-MCPPAT(c)的检验效能与基于完整数据的Q-PPAT(c)的检验效能非常接近。 (2)基于多种不同背景的模拟研究表明,当哈代-温伯格平衡律(Hardy-Weinberg Equilibrium, HWE)在人群中成立时,在无关联、无遗传印记效应的原假设条件下,PDTI和MCPDTI的第一类错误率都是准确的。在哈代温-伯格平衡律在人群中不严格成立的模拟背景下,PDTI和MCPDTI依然可以很好地控制犯第一类错误的概率。当遗传印记效应存在时,PDTI和MCPDTI都比PDT和TDTI*(基于家系中随机抽取的一个核心家庭)有更加高的检验效能。当遗传印记效应不存在时,PDTI和MCPDTI拥有与PDT几乎同样的检验效能,而且依然比TDTI*的检验效能高。 结论: (1)在无关联、无遗传印记的原假设条件下,Q-PPAT(c)和Q-MCPPAT(c)能把第一类错误控制得较好,这就证实了这两种方法是有效的。另一方面,通过充分利用整个家系数据,Q-PPAT(c)和Q-MCPPAT(c)与只能使用两代人核心家庭数据的Q-C-PAT(c)方法相比,有更高的检验效能。Q-MCPPAT(c)利用Monte Carlo模拟和估计的方法,对大量缺失信息进行了反推,因而其检验效能与使用完整数据的Q-PPAT(c)方法几乎相同。 (2)当HWE成立时,在无遗传印记效应和无关联的原假设条件下,PDTI和MCPDTI有准确的第一类错误率,这说明PDTI和MCPDTI是有效的关联分析方法。然而,即使HWE在人群中有轻微的偏离,PDTI和MCPDTI在原假设下,依然能较好地控制犯第一类错误的概率。通过合并遗传印记效应的信息以及充分利用广义家系数据,PDTI和MCPDTI的检验效能比不考虑遗传印记效应的PDT方法更高,而且也比只使用两代人核心家庭的TDTI*方法要高。当遗传印记效应不存在时,PDTI和MCPDTI与PDT有几乎相同的检验效能,其依然比TDTI*的检验效能要高。总的来说,由于PDTI和MCPDTI充分利用了家系信息,而且把遗传印记的效应合并到关联分析中,因而比PDT和TDTI*有更好的表现。
[Abstract]:Background:
Genetic imprinting is the offspring of some specific alleles from different gender parents caused a genetic phenomenon of differences in the phenotype, it plays an important role in the study of complex diseases. For human a two allele loci, when the genotype of the individual family without core the absence of Q-PAT (c) (parental-asymmetry test with any constant C for quantitative trait, the parent of asymmetric test, quantitative traits C is an arbitrary constant), is a method of testing effect of genetic mark number is simple and efficient. When the core family data only one parent information, Q-1-PAT (c) can be used to test the imprinting effect for mixed data type data information and only single parent family parents have information of family data, Q-C-PAT (c) can be used to merge these two types of data and calculate the overall statistics of genetic India Remember the effect test. However, although the Q-C-PAT (c) is a genetic imprinting effect test method is simple and efficient, but it applies only to the core family of two generations only and is not suitable for general family data, thus wasting a lot of useful information, and ultimately reduce the inspection efficiency. On the other hand, PPAT (pedigree parental-asymmetry test, based on the pedigree data of the parental asymmetry test) and MCPPAT (Monte Carlo pedigree parental-asymmetry test, based on the pedigree data of the Monte Carlo method can be used to test the asymmetry of parental genetic imprinting) test pedigree data. However, these two kinds of test methods can only be used for genetic imprinting test quality trait loci, genetic imprinting test not suitable for quantitative trait loci.
In recent years, localization of association analysis has been widely used in quality traits disease sites. More and more studies show that if there is genetic imprinting effect, after the combined effect of genetic imprinting information, inspection efficiency will be enhanced. The correlation analysis for two allele loci, pedigree data based on PDT (pedigree disequilibrium test, pedigree disequilibrium test) and its extension can deal with missing data (MCPDT Monte Carlo pedigree disequilibrium test, Monte Carlo pedigree disequilibrium test) method is an efficient analysis method. However, they are not in the correlation analysis, considering the effect of genetic imprinting effect. When the effect of genetic imprinting when this approach will reduce its effectiveness. On the other hand, with the effect of genetic imprinting transmission disequilibrium test TDT* although they can be genetic imprinting effect It is incorporated into association analysis, but it only applies to the core family of two generations and does not apply to broad family data.
Method锛,
本文编号:1559182
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/1559182.html
最近更新
教材专著