高维组学研究中的贝叶斯多位点模型
发布时间:2021-02-21 12:27
在数十年的全基因组关联研究热潮中,大量与人类复杂性状相关联的单核苷酸多态性位点被成功挖掘。然而,这些关联位点仅能解释性状的很少一部分遗传度,我们称之为“遗传度缺失”(missing heritability)现象。该现象的一个合理解释是通用的单位点检验方法较难发现弱效应位点。多位点模型通常具有较高的统计学效能,而大规模高维组学数据下构建多位点模型则面临挑战。第一部分,在适应性条件双指数先验的框架下,构建基于变分推断算法的贝叶斯多位点模型(BAL-VI)。通过适应性条件双指数先验达到对位点效应适应性惩罚的目的;通过变分推断算法达到高维数据下快速、准确进行贝叶斯后验计算的目的。模拟试验中评价了模型在变量选择、参数估计和结局预测方面的表现,并就几个重要问题作探讨:模型区间估计宽度、高相关结构下变分算法与MCMC算法的估计性质以及超参数敏感性分析。实例分析将模型应用于肺癌GWAS数据。模拟试验结果表明,(1)BAL-VI的95%贝叶斯可信区间狭窄,基于该指标的变量选择产生大量的假阳性,借助于额外的遗传度阈值可以有效控制假阳性;(2)综合变量选择、参数估计和预测结果,BAL-VI表现最佳;(3)...
【文章来源】:南京医科大学江苏省
【文章页数】:145 页
【学位级别】:博士
【部分图文】:
标准正态分布与Laplace分布(λ=1,2,5)
28图 1-2. 模型下各位点在重复模拟中的选择比例(n=500,p=1,000)左图对应情境 A1 模拟参数,遗传度 h2=0.2;右图对应情境 A2 模拟参数,遗传度 h2=0.5;A、B、C 子图对应模型 BL、BAL-MCMC、BAL-VI;倒三角形表示指定的阳性位点。
29图 1-3. 模型下各位点在重复模拟中的选择比例(n=1,000,p=10,000)左图对应情境 A3 模拟参数,遗传度 h2=0.2;右图对应情境 A4 模拟参数,遗传度 h2=0.5;A、B、C 子图对应模型 BL、BAL-MCMC、BAL-VI;倒三角形表示指定的阳性位点。
本文编号:3044344
【文章来源】:南京医科大学江苏省
【文章页数】:145 页
【学位级别】:博士
【部分图文】:
标准正态分布与Laplace分布(λ=1,2,5)
28图 1-2. 模型下各位点在重复模拟中的选择比例(n=500,p=1,000)左图对应情境 A1 模拟参数,遗传度 h2=0.2;右图对应情境 A2 模拟参数,遗传度 h2=0.5;A、B、C 子图对应模型 BL、BAL-MCMC、BAL-VI;倒三角形表示指定的阳性位点。
29图 1-3. 模型下各位点在重复模拟中的选择比例(n=1,000,p=10,000)左图对应情境 A3 模拟参数,遗传度 h2=0.2;右图对应情境 A4 模拟参数,遗传度 h2=0.5;A、B、C 子图对应模型 BL、BAL-MCMC、BAL-VI;倒三角形表示指定的阳性位点。
本文编号:3044344
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3044344.html