当前位置:主页 > 医学论文 > 护理论文 >

主成分分析用于校正人群分层时位点选择策略的探讨

发布时间:2018-03-16 02:12

  本文选题:全基因组关联研究 切入点:千人基因组计划 出处:《南京医科大学》2015年硕士论文 论文类型:学位论文


【摘要】:全基因组关联研究(Genome-wide association study,GWAS)已经成功鉴别出了许多与复杂疾病(complex disease)/可测性状(observable trait)有关的易感性位点。众所周知,在复杂疾病的全基因组关联研究中,人群分层(population stratification)现象是一个重要的问题。如果这种混杂效应没有得到适当的控制,可能会增加结果的假阳性率,导致虚假关联。因此,在GWAS中充分考虑人群遗传结构,控制人群分层是十分必要的。目前,用于全基因组关联研究中控制人群分层的方法有很多,比如:主成分分析(principal component analysis,PCA),基因组对照(genomic control,GC),混合模型(mixed models)等。PCA由Hotelling于1933年提出,是经典的多元统计分析方法之一。该方法通过将高维空间的问题投影到低维空间,在损失少许信息的基础上,最终提取到最有效的信息。在GWAS中,PCA被广泛用于检测人群亚结构、校正人群分层和对人类历史变迁做出合理的推论等方面。本研究利用“千人基因组计划”中的低覆盖度全基因组测序数据(low-coverage whole genome sequencing dataset)与高覆盖度全基因组测序数据(high-coverage whole genome sequencing dataset),探讨基于不同种类变异位点构建主成分是否可以用于识别不同大陆人群(European,Asian和African),尤其是识别遗传结构上更为相近的European和Asian。最终旨在提供全基因组关联研究中校正人群分层时位点选择的策略,同时进一步阐明各个大陆人群历史起源及变迁过程。研究内容包括以下三个方面:(1)基于“1000genome”网站上下载到的2010年8月份完成的低覆盖度全基因组测序(low-coveragewgs)数据,首先利用其中的1号染色体数据,将不同种族人群之间的变异位点进行匹配以得到共同的位点,然后将共有的变异位点进行分类,分为常见变异(commonvariants,cv),低频变异(low-frequencyvariants,lfv)和罕见变异(rarevariants,rv)。之后,基于每一种变异位点以及它们的组合构建主成分,来检测利用不同位点构建主成分时用于人群分层的效果。(2)基于以上low-coveragewgs数据中所有染色体数据,首先针对每条染色体上不同种族人群间的位点进行匹配得到相同位点,然后将22条染色体的位点进行整合得到三个人群的全基因组共有变异位点数据,将整合后的变异位点进行分类,分为cv,lfv与rv。最终,基于每一种变异位点以及它们的组合构建主成分,探索利用不同位点构建主成分时用于人群分层的效果。(3)基于“1000genome”网站上下载到的2011年6月份完成的高覆盖度全基因组测序(high-coveragewgs)数据,利用其中五条染色体数据(1号,5号,10号,15号与20号染色体),其余数据预处理步骤及构建主成分的方式均与以上相同。本研究的主要结果是:(1)low-coveragewgs数据中1号染色体结果:基于cvs或lfvs所构建的前两个主成分便能够很好的将eur、asn和afr人群分开,cvs的表现稍优于lfvs,但rvs的效果并不理想。除此之外,基于不同组合的位点构建主成分,即cvs+lfvs、cvs+rvs和cvs+lfvs+rvs,三者识别不同种族的能力与单独利用cvs效果相近,但相对于单独利用lfvs有明显的改善。与此同时,选择以上效果最优的cvs用于每个洲的亚群分层,发现其能够较好的识别亚群遗传结构,尤其是对于afr的亚群分层。(2)low-coverage WGS数据中所有染色体结果:与以上的结果一致。但值得一提的是,在利用全基因组数据之后,每种变异位点进行人群分层的效果有了进一步提升。且CVs用于亚群分层的结果也有了进一步的提升。以上两种结果都可以从人群分层的定量结果中获得。(3)high-coverage WGS数据中五条染色体结果:与以上的结果基本一致。但值得一提的是,被分开的每个洲的人群都有较高的集中程度,尤其对于欧洲和亚洲来说,人群较集中,没有多余的散点。同时发现RVs的效果优于以上低覆盖度数据中RVs的结果,其能够很明显地将AFR和non-AFR分开。
[Abstract]:......
【学位授予单位】:南京医科大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R440

【相似文献】

相关期刊论文 前10条

1 范p,

本文编号:1617869


资料下载
论文发表

本文链接:https://www.wllwen.com/huliyixuelunwen/1617869.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户05d96***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com