基于全基因组关联研究的复杂性状遗传风险预测研究
本文关键词:基于全基因组关联研究的复杂性状遗传风险预测研究,,由笔耕文化传播整理发布。
【摘要】:全基因组关联研究(genome-wide association study,GWAS)已经被认为是阐明复杂性状遗传关联机制的强有力工具。截止2014年10月底,全球的研究者们累计发现了与1,251种性状(疾病)相关的19,602个单核苷酸多态性(Single Nucleotide Polymorphism,SNP)位点,而具体到某一类性状,只有少数位点可以通过GWAS研究的多阶段严格验证,而这些位点仅能解释很小一部分的遗传变异。大量的研究表明,仅利用已经验证的关联位点进行遗传风险预测效果并不理想,其中的一个主要原因在于这些研究忽略了大量存在的、未被发掘的低效应位点,因此如何充分利用GWAS研究信息成为预测模型成败的关键。近来,主要有两类策略被提出,表现出较好的预测效果:一类是通过设定宽松的假设检验水准,以便纳入一些潜在的关联位点;另一类是借助于混合效应模型将全基因组所有常见变异位点纳入预测模型。本文针对上述两种策略,提出了s GRS和s GRS-LMM方法,旨在探讨其在复杂性状遗传风险预测中的表现。本研究的目的:一是通过与其它方法进行比较来评价s GRS和s GRS-LMM方法的预测准确度;二是探讨影响预测准确度的因素,用以指导预测研究。本研究利用模拟试验,比较BLUP、AM-BLUP、w GRS、RF、s GRS和s GRS-LMM六种方法在高维复杂结构遗传数据中的遗传预测表现,并将这些方法应用到中国人群非小细胞肺癌GWAS数据的遗传风险预测研究。研究内容包括模拟试验和实例分析两个方面:1.基于1号染色体的模拟数据:采用实例GWAS数据的1号染色体基因分型数据,通过设定不同的样本量、遗传度、风险位点个数以及疾病患病率等参数,模拟产生所需的连续性表型和二分类表型,然后应用六种方法进行预测分析。2.实例分析:利用中国汉族人群非小细胞肺癌GWAS数据,将南京研究数据作为训练集,用于建立六种方法的预测模型,北京研究数据作为测试集,用以评价各方法的预测准确度。研究的主要结果:1.模拟数据结果:在绝大多数参数组合情况下,s GRS和s GRS-LMM的预测准确度均优于其它方法;样本量、遗传度、预设风险位点个数以及疾病患病率均是影响各方法预测准确度的因素;连续性表型和二分类表型的结论基本相似。2.实例分析结果:s GRS和s GRS-LMM的预测准确度均优于其它方法,而且s GRS-LMM预测准确度最高,AUC值达到0.735,但与理论预测准确度相比还有一定差距。结论模拟试验和实例分析均表明sGRS和sGRS-LMM可以用于全基因组数据的遗传风险预测研究,总体表现优于同类方法。
【关键词】:全基因组关联研究 遗传风险预测 遗传风险得分 混合效应模型 非小细胞肺癌
【学位授予单位】:南京医科大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R394;R734.2
【目录】:
- 中文摘要7-9
- Abstract9-11
- 1 前言11-13
- 2 背景方法介绍13-21
- 2.1 风险预测评价指标13
- 2.2 遗传方差与遗传度估计13-18
- 2.3 遗传风险预测方法18-20
- 2.4 统计软件20-21
- 3 模拟试验21-39
- 3.1 模拟试验目的21
- 3.2 模拟试验设计21-23
- 3.3 模拟试验结果23-39
- 3.3.1 连续性表型23-31
- 3.3.2 二分类表型31-39
- 4 实例分析—非小细胞肺癌39-44
- 4.1 资料来源39
- 4.2 研究对象39
- 4.3 基因分型与质量控制39-40
- 4.4 遗传方差分析40
- 4.5 风险预测策略与结果40-42
- 4.6 实例讨论42-44
- 5 讨论44-47
- 5.1 关于复杂疾病的遗传风险研究44
- 5.2 遗传风险预测方法评价44-46
- 5.3 遗传方差与遗传度估计46-47
- 6 总结47-50
- 6.1 研究结论47
- 6.2 研究特点47-48
- 6.3 研究局限48-49
- 6.4 研究展望49-50
- 参考文献50-54
- 综述目录54-55
- 文献综述55-72
- 参考文献69-72
- 攻读硕士学位期间发表论文情况72-73
- 致谢73-74
【相似文献】
中国期刊全文数据库 前10条
1 郑兴华,严明良,周曾奎,唐勇,吴震,冯民学;洪水风险预测业务系统[J];气象;1999年12期
2 王t@;李巧萍;;国际减灾术语(2009年版)[J];防灾博览;2010年02期
3 黄锐;;基于神经网络与灰色系统模型的巨项目风险预测[J];价值工程;2012年03期
4 赵耀文;基于专家经验神经网络的高技术投资风险预测和评价方法研究[J];技术经济;2002年07期
5 胥悦红,刘嘉X;马氏链在国际工程投标风险预测中的应用[J];华侨大学学报(自然科学版);1999年04期
6 陈峗;聂波;;高速公路经营主体行为风险预测[J];工业技术经济;2005年09期
7 李艳;吴介军;寇晓东;韩志兵;;基于PCA-RBF网络的高校保密项目风险预测[J];科技管理研究;2011年05期
8 吴皓;秦新东;黄亚;;炮兵武器装备全寿命周期风险预测研究[J];科技情报开发与经济;2009年04期
9 王珂;邵宏成;;基于VAR理论的ARMA(1,1)—GARCH(1,1)法的股指期货的风险预测[J];商场现代化;2009年15期
10 胡胜;任高飞;;浅述信用风险附加模型与信贷组合模型[J];山东纺织经济;2011年05期
中国重要会议论文全文数据库 前3条
1 郜烨;董国丽;张洁;郜华萍;胡学伟;史建武;;黄磷生产危险因子及环境风险预测[A];第十六届中国科协年会——分3环境污染及职业暴露与人类癌症学术研讨会论文集[C];2014年
2 周焯华;艾林;张宗益;;基于专家规则的遗传算法对商业银行操作风险预测[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
3 朱玉梅;胡佳哲;刘小立;周继昌;;高敏C-反应蛋白在预防医学中的应用价值[A];2012深圳市预防医学会学术研讨会论文汇编[C];2012年
中国重要报纸全文数据库 前10条
1 朱虎、李培杨、靳建坤 李林、杨帆 特约记者 陈桂峰;依据法规管 盯着弱项抓[N];人民武警;2009年
2 郑轩;海西推行社会稳定风险预测评估制度[N];青海日报;2007年
3 邵云 李永刚 仓p
本文编号:268874
本文链接:https://www.wllwen.com/yixuelunwen/binglixuelunwen/268874.html