当前位置:主页 > 医学论文 > 预防医学论文 >

稀有变异关联性分析中折叠与非折叠法的模拟比较研究

发布时间:2017-05-30 20:06

  本文关键词:稀有变异关联性分析中折叠与非折叠法的模拟比较研究,由笔耕文化传播整理发布。


【摘要】:目的复杂疾病是基因和环境因素共同作用的结果,为识别与复杂疾病有关的遗传变异,遗传流行病学家已提出多种基于基因连锁和/或基因关联性分析的统计学方法。近年来,全基因组关联研究(genome-wide association studies,GWAS)在常见变异(common variant)与复杂疾病或性状关联分析中取得了巨大的成就。但同时也发现,常见变异仅能解释疾病或性状遗传度的很少比例,此现象称为“遗传缺失(missingheritability)”。一个很有可能的原因就是,稀有变异(rare variant)对复杂疾病存在中到强度的影响。然而面对在人群中频率极低的稀有变异,如果仍然沿用GWAS中分析常见变异的统计学方法鉴别稀有变异对疾病的影响,得到的效能是非常低下的。随着全基因组测序技术的进步,稀有变异数据越来越容易获得,对稀有变异的探索将提高我们对人类疾病和性状生物学机制的理解。本研究可为分子遗传流行病学者在研究稀有变异和疾病关联时选择适宜的稀有变异关联分析统计方法提供参考和理论依据,并为稀有变异关联分析统计方法实际应用的推广和普及提供理论和方法学上的支持。 方法根据DNA序列稀有变异疾病状态作用模式假设,研究10种稀有变异关联性分析方法,,通过设置不同的样本量、非关联稀有变异数目、关联稀有变异效应值大小及其方向、关联稀有变异权重以及变异间连锁不平衡状态水平,系统模拟不同影响因素组合下的遗传情境,探讨不同模型原理的稀有变异关联性分析方法的适用条件,并比较这些方法在不同遗传情境中的I类错误和效能。所有的方法运算过程均在R3.0.2软件中完成。 结果各方法方法一类错误均保持在0.05水平上下。关联稀有变异的效应大小和方向均相同时,随样本量增大、连锁不平衡参数增加和非关联变异个数减少各方法效能增高;小和中样本量且连锁不平衡参数为0时,无方向考虑的三种方法(CMC、w-Sum和SUM)和aSum在非关联变异不存在或个数较少时表现更突出应。关联稀有变异的效应大小相同但方向不同时,除大样本外各法效能均显著降低。总的来说,连锁不平衡参数越大,非关联变异数量越多,各方法效能更进一步降低。有方向考虑的折叠法(SSU、SSUw、aSUM)和非折叠法(C-α、SKAT_linear、SKAT_wlinear和RR)均高于无方向考虑的折叠法;高连锁不平衡时RR方法表现最优。当关联稀有变异效应权重为MAF的方差倒数时,总的来说,随着连锁不平衡参数增加非关联稀有变异个数减少,各方法效能逐渐升高。无非关联变异干扰时,w-Sum效能高于CMC;连锁不平衡参数为0和0.5时,SSUw和SKAT_wlinear效能分别高于SSU和SKAT_linear效能。 结论所有的方法在各自相适宜的遗传情境下都表现出良好的性能。无方向考虑的折叠法适合简单的遗传环境,其他方法在其他较为复杂的遗传环境中仍能保持良好的性能。两种方法起到互补的作用。
【关键词】:稀有变异关联性分析 折叠法 非折叠法
【学位授予单位】:广东药学院
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:R181.33
【目录】:
  • 摘要5-7
  • Abstract7-10
  • 1 前言10-18
  • 1.1 稀有变异关联性研究的发展及现状10-12
  • 1.2 稀有变异影响疾病表型的作用模式假设12-13
  • 1.3 稀有变异关联研究统计方法研究现状13-17
  • 1.4 本研究主要内容和研究意义17-18
  • 2 模型原理与方法18-36
  • 2.1 本研究数据结构18
  • 2.2 置换检验(permutation test)18-19
  • 2.3 稀有变异关联性研究方法19-36
  • 2.3.1 多元与折叠合并法(Combined Multivariate and Collapsing , CMC)19-20
  • 2.3.2 权重加和检验(weight Sum test,w-Sum)20-22
  • 2.3.3 加和检验(SUM test)22-23
  • 2.3.4 基于边际得分统计量的改良方法:SSU 和 SSUw23-24
  • 2.3.5 数据自适应加和检验(data-adaptive Sum test,aSum)24-26
  • 2.3.6 C-α检验方法26-28
  • 2.3.7 序列核关联性检验(Sequence Kernel Association Test,SKAT)28-31
  • 2.3.8 岭回归(Ridge Regression,RR)31-36
  • 3 模拟研究36-44
  • 3.1 参数设置36-39
  • 3.2 模拟数据集的产生39-42
  • 3.3 评价指标42
  • 3.4 统计软件42-44
  • 4 结果44-64
  • 4.1 样本量为 250 时各类方法的一类错误和效能44-50
  • 4.1.1 各类方法的一类错误44
  • 4.1.2 各类方法的效能44-50
  • 4.2 样本量为 500 时各类方法的一类错误和效能50-55
  • 4.2.1 各类方法的一类错误50
  • 4.2.2 各类方法的效能50-55
  • 4.3 样本量为 1000 时各类方法的一类错误和效能55-60
  • 4.3.1 各类方法的一类错误55
  • 4.3.2 各类方法的效能55-60
  • 4.4 样本量对各种方法的影响60-64
  • 4.4.1 对各种方法一类错误的影响60
  • 4.4.2 对各种方法效能的影响60-64
  • 5 讨论64-72
  • 5.1 关联变异效应大小和作用方向的影响65
  • 5.2 连锁不平衡状态的影响65-66
  • 5.3 非关联变异数量的影响66-67
  • 5.4 关联变异权重的影响67
  • 5.5 样本量的影响67-72
  • 6 主要结论和应用建议72-74
  • 7 本研究的创新点与局限性74-76
  • 7.1 本研究创新之处74
  • 7.2 本研究不足之处及进一步研究方向74-76
  • 附录 1 aSum、SKAT-linear、SKAT-wlinear、SSU、SSUw、Sum 以及 C-α方法的 AssotesteR 包调用和运算 R 程序76-78
  • 附录 2 RR 方法的 RVtests 包调用和运算 R 程序78-80
  • 参考文献80-96
  • 攻读硕士学位期间发表论文96-98
  • 致谢98-99

【共引文献】

中国期刊全文数据库 前10条

1 陈肯界;;小额信贷促进农户增收效应的地区差异分析[J];当代经济;2014年03期

2 尹玲;夏蕾;许才国;;基于随机森林的女性体型判别[J];纺织学报;2014年05期

3 陈廷武;;基于方差分析的监测网稳定性假设检验方法[J];工程勘察;2014年04期

4 刘惠兰;周静;朱华亮;徐光清;丁霞;张苗苗;;自动观测与人工观测能见度的差异性分析及检验[J];安徽农业大学学报;2014年03期

5 张佳进;陈立畅;陈克平;唐君君;;基于R语言的农业试验统计软件的设计与实现[J];电子设计工程;2014年14期

6 欧祖军;李洪毅;;R软件在方程求根中的应用[J];兰州文理学院学报(自然科学版);2014年05期

7 吴欢;谢德悠;;基于集成预测模型的贵州省农作物受灾面积预测[J];贵州大学学报(自然科学版);2014年04期

8 李亭;田原;邬伦;刘亮;;基于随机森林方法的滑坡灾害危险性区划[J];地理与地理信息科学;2014年06期

9 陈胤华;张克乾;;公元1180和1181年浙江金华地区梅汛期降水的重建[J];古地理学报;2014年06期

10 戴雪;万荣荣;杨桂山;王晓龙;;鄱阳湖水文节律变化及其与江湖水量交换的关系[J];地理科学;2014年12期

中国重要会议论文全文数据库 前1条

1 孙涵亮;陆伟;朱雯卿;;互动电视收集用户行为信息研究[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(二等奖)[C];2014年

中国博士学位论文全文数据库 前4条

1 王霞;马尾松人工林近自然化改造初期效果分析研究[D];北京林业大学;2013年

2 刘鑫;中国金融市场化过程中的货币需求、货币供给与货币政策[D];东北财经大学;2013年

3 王洁丹;人口死亡率水平的数量研究[D];厦门大学;2014年

4 张克慧;支撑性资产内部价值与定价研究[D];财政部财政科学研究所;2014年

中国硕士学位论文全文数据库 前10条

1 金颖;Copula函数的稳健性和不确定性分析[D];长安大学;2013年

2 薛洁;关于GIS不确定性传播问题的若干研究[D];长安大学;2013年

3 雷特;基于LT公司销售数据的需求预测与库存控制[D];华中科技大学;2013年

4 孙俊;实力非对称对博弈策略选择的影响[D];云南财经大学;2013年

5 张凯;基于蒙特卡罗模拟的最小二乘统计量性质的研究[D];天津财经大学;2013年

6 臧亮亮;沪深股市收益率及其相关性的实证分析[D];天津财经大学;2013年

7 郭俊峰;中小板股票市场波动性研究[D];南京财经大学;2013年

8 王婷婷;死亡率模型的拓展研究和中国人口死亡率的预测[D];浙江大学;2014年

9 古俊哲;有限高斯混合模型聚类算法的研究[D];兰州商学院;2014年

10 原少斌;回归分析中异常值诊断方法的比较研究[D];兰州商学院;2014年


  本文关键词:稀有变异关联性分析中折叠与非折叠法的模拟比较研究,由笔耕文化传播整理发布。



本文编号:407833

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/407833.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77390***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com