X染色体标记位点上Hardy-Weinberg平衡律的似然比检验及印记效应的检验
发布时间:2017-09-06 14:53
本文关键词:X染色体标记位点上Hardy-Weinberg平衡律的似然比检验及印记效应的检验
更多相关文章: X染色体 似然比检验 标记位点 近交系数 质量性状 印记效应
【摘要】:背景:关联分析是一种通过标记位点来定位疾病位点的有用工具,在病例对照数据与家系数据中都有广泛的应用。它利用标记位点与疾病位点间的关系来定位变异基因。如果标记位点离疾病位点很近,这样会导致连锁不平衡,那么两位点同时被传递的可能性很大。于是,患病人群中该标记等位基因频率要高于或低于正常人群。所以,关联分析通过标记位点定位了疾病位点。常染色体上基于病例对照研究的关联分析通常需要Hardy-Weinberg平衡律(Hardy-Weinberg equilibrium)的假设。如果Hardy-Weinberg平衡律不成立时,基于病例对照数据的关联分析方法的第一类错误率可能会偏大。而今,X染色体上标记位点与疾病位点间关联性的检验方法研究以及Hardy-Weinberg平衡律对关联分析的影响研究越来越受到重视。然而,在X染色体上,有两个问题需要被关注:(1)对于同一个位点上的同一等位基因,男性与女性的等位基因频率是否相等;(2)女性群体中的近交系数是否为0。因此,男、女性间的等位基因频率是否有显著差异和女性中的Hardy-Weinberg平衡律是否成立经常用来筛选X染色体上连锁的变异基因。对于(1)和(2),已经有学者提出了相应的方法分别对其进行检验。然而,这些方法的第一类错误率和检验效能还没有被探讨与研究。另外,目前尚未见文献报导同时检验(1)与(2)的方法。印记效应(imprinting effects),也称亲源效应(parent-of-origin effects),是一种有关亲代基因的表达与否的后生现象,对研究基因对表型的影响有着非常重要作用。基因印记是一种非孟德尔遗传现象。如果后代来自父亲的等位基因没有被表达,而来自母亲的等位基因被表达,此现象称为父系印记;反过来,如果只有来自父亲的基因被表达而来自母亲的基因没有被表达,即为母系印记。存在印记效应时,两种有序杂合子基因型的外显率可能是不同的。常染色体上常见的与印记相关的疾病有:Angelman综合征、Beckwith-Wiedemann综合征、Prader-Willi综合征、肥胖症、糖尿病等。而X染色体上与印记效应相关的疾病有Turner综合征。Turner综合征只在女性个体中存在,可能是由其中一整条X染色体的缺失或者部分缺失引起。所以,印记效应的检验在研究遗传疾病方面有重要意义。常染色体上已经有很多检验印记效应的方法,但这些方法都不适用于X染色体。到目前为止,我们尚未发现X染色体上印记效应的检验方法。需要注意的是,X染色体在男、女性间的遗传是不对称的。女性有两条X染色体,一条是父系的,一条是母系的;而男性只有一条母系的X染色体。这种不对称性使得研究X染色体上印记效应检验的方法更加困难。另一方面,目前已经有很多基于家系或病例对照数据的X染色体上关联分析方法。但是,在关联存在的情况下,尚未有方法用于检验X染色体上的印记效应。本文的研究目的主要有以下两点:(1)基于X染色体上的标记位点,提出检验Hardy-Weinberg平衡律的似然比方法;(2)针对不同的核心家庭结构,提出检验印记效应的非参数方法。方法:(1)首先,基于X染色体上收集的样本,通过合并Zheng等人提出的两个检验统计量(检验男、女性间的等位基因频率是否相等(Z1)以及女性群体中的近交系数是否为0(Z2)),提出Z0统计量来同时检验(1)男性等位基因频率等于女性等位基因频率和(2)女性群体中的近交系数为0。为了提高此方法的检验效能,我们进一步提出一种新的似然比检验方法。对于X染色体上的某一个位点,首先分别写出原假设和备择假设下的似然函数。然后,用EM算法得到未知参数的最大似然估计值并且构建LRTo统计量来同时检验(1)和(2)。如果原假设被拒绝,则进一步构造两个假设检验来找到原假设被拒绝的原因。于是,提出另外两个似然比检验统计量,LRT1(检验男女性的等位基因频率是否相等)和LRT2(检验女性中近交系数是否为0)。值得注意的是,从模拟结果可以看出,LRTo和LRT2的第一类错误率偏保守。因此,我们用参数的bootstrap方法来评价LRTo和LRT2的有效性及其表现,分别记为LR-Tob和LRT2b。而且,我们还探讨了群体分层对新提出方法的影响。另外,我们用均方根误和偏差来评估未知参数的最大似然估计值的估计准确性。最后,我们使用了来自北美的类风湿关节炎基因数据对新提出方法加以实例验证。(2)考虑在关联存在的前提下,提出x染色体上质量性状的印记效应检验方法。首先,针对父母和患病女儿组成的三联体家庭,用统计量XPAT (parental-asymmetry test on X chromosome)来检验X染色体上的印记效应。然后,基于两人家庭(父亲-女儿对或母亲-女儿对),提出检验统计量1-XPAT。通过同时考虑三联体和两人家庭,构造统计量C-XPAT来检验印记效应。更进一步地,我们把这三种方法拓展到可以纳入多个小孩且其中至少有一个患病女儿的完整家庭(家庭成员的基因信息是完整的)和不完整核心家庭(父代中父亲或母亲的基因信息缺失)。值得注意的是,因为1-XPAT统计量中需要用到等位基因频率,我们用三种方式加以处理:用真实的等位基因频率,相应的统计量记为1-XPATt;用母亲等位基因频率的估计值,相应的统计量记为1-XPATm;用父亲等位基因频率的估计值,相应的统计量记为1-XPATfo最后,我们使用了来自北美的类风湿关节炎基因数据对新提出方法加以实例验证。结果:(1)模拟结果表明,LRT0和LRT2的第一类错误率均偏保守,LRT1的第一类错误率接近显著性水平。而LRT0和LRT2经过参数的bootstrap方法校正后(LRTob和LRT2b)能很好地控制犯第一类错误的概率。Z0,Z1和Z2也能很好地控制第一类错误率。通过不同的参数设置来比较这几个统计量的检验效能,LRTob的检验效能比LRTo与Z0的都要高,而LRTo和Zo的检验效能很接近;LRT1和Z1的检验效能也很接近;当近交系数大于0时,LRT2b的检验效能比LRT2与Z2的都要高,且LRT2比Z2的检验效能稍微小一点。对于男性等位基因频率的估计值,不管用EM算法估计或Zheng等人的方法估计,值是一样的;对于女性等位基因频率和合并等位基因频率的估计值,不管是用EM算法估计或Zheng等人的方法估计,其均方根误和偏差都很接近。而对于近交系数的估计值,在某些情况下,虽然基于EM算法的偏差比Zheng等人的稍大,但是在所有情况下,基于EM算法的均方根误都比Zheng等人的要小。另外,群体分层模型确实会导致近交系数不为0,这跟Overall和Nichols的结论是一致的。此时基于EM算法的近交系数估计值的均数比Zheng等人的估计值稍大,但相应的标准差要小。另外,类风湿关节炎数据的分析结果表明,虽然没有找到有统计学意义的位点,但证实了新提出方法的实用性。(2)在不同的参数设置情况下,对新提出方法的第一类错误率和检验效能进行了模拟。模拟结果表明,XPAT在各种参数设置下的第一类错误率都在显著性水平附近;1-XPATt和1-XPATm的第一类错误率保持在显著性水平附近,但1-XPATf严重偏大。因此,在后续的模拟研究中,我们仅用母亲等位基因频率的估计值计算1-XPAT的值。通过纳入不完整核心家庭,C-XPAT的检验效能比只纳入完整核心家庭的XPAT明显要高很多。另外,不管女性群体中的近交系数是否为0,新提出方法的第一类错误率一直保持在显著性水平附近。类风湿关节炎数据的分析结果表明,虽然没有找到与印记相关的有统计学意义的位点,但证实了新提出方法的实用性。结论:(1)为了提高检验X染色体上Hardy-Weinberg平衡律的检验效能,提出了三种似然比检验方法。但由于其中有两个统计量的第一类错误率偏保守,所以我们采用参数的bootstrap方法寻找其分布的临界值。模拟结果表明,基于bootstrap方法的LRTob和LRT2b,LRT1,Zo和之前的Z1和Z2的第一类错误率在各自的原假设下都能控制在显著性水平的附近。通过检验效能的比较,LRTob的检验效能比LRT0和Z0都高。在近交系数大于0的情况下,LRT2b的检验效能比LRT2和Z2高很多,然而LRT2比Z2的检验效能稍微小一点。另外,在男性等位基因频率不等于女性等位基因频率的情况下,LRT1和Z1的检验效能很接近。(2)在X染色体上的标记位点与疾病位点存在关联的情况下,针对质量性状,提出检验印记效应的方法。首先,基于由父母和他们患病的女儿组成的三联体家庭,构建X染色体上的亲代不对称检验XPAT。然后,我们用1-XPAT来处理两人家庭(父女对或母女对)。通过同时考虑三联体家庭和两人家庭,我们用C-XPAT来检验印记效应。更进一步地,我们把这三种方法拓展到可以处理完整和不完整核心家庭,这两种核心家庭中可以包含多个女儿,但至少有一个女儿是患病的。在不同的参数设置下,我们通过模拟研究来评估新提出方法的第一类错误率和检验效能。模拟中的样本主要考虑三种不同家庭结构,这样比只考虑一种结构更加合理。模拟结果表明,在不同的参数设置下,新提出方法的第一类错误率被控制得很好。通过检验效能的比较,不论用真实等位基因频率或母亲的基因型估计的等位基因频率,C-XPAT的检验效能都比XPAT高。在此研究中,不需要女性群体中Hardy-Weinberg平衡律成立的假设,这一点已经在理论推断和模拟研究中被证实。
【关键词】:X染色体 似然比检验 标记位点 近交系数 质量性状 印记效应
【学位授予单位】:南方医科大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R394
【目录】:
- 摘要3-8
- ABSTRACT8-15
- 第一章 前言15-21
- 1.1 基本概念15-17
- 1.2 印记效应17
- 1.3 关联分析17-18
- 1.4 论文组成部分18-19
- 1.5 参考文献19-21
- 第二章 X染色体标记位点上Hardy-Weinberg平衡律的似然比检验21-73
- 2.1 引言21-22
- 2.2 方法22-28
- 2.3 结果28-40
- 2.4 讨论40-44
- 2.5 附录44-70
- 2.6 参考文献70-73
- 第三章 X染色体上基于质量性状和核心家庭的遗传印记效应检验方法73-111
- 3.1 引言73-74
- 3.2 方法74-79
- 3.3 结果79-90
- 3.4 讨论90-93
- 3.5 附录93-109
- 3.6 参考文献109-111
- 第四章 研究展望111-112
- 硕士论文发表情况112-113
- 致谢113-115
- 基金115-116
本文编号:803785
本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/803785.html
最近更新
教材专著