当前位置:主页 > 科技论文 > 基因论文 >

基因关联分析中若干稳健统计检验方法研究

发布时间:2020-10-14 22:28
   随着现代生物学技术的发展,已经有千余位点单核苷酸多态性与复杂疾病关联被成功识别.本文首先按照从考虑单个位点到考虑多个位点的顺序回顾了全基因关联分析中的统计方法,介绍完成论文所需要的统计遗传、概率论与数理统计、统计计算等领域的一些预备知识.接下来,本文提出了适合三个具体问题的基因关联分析的统计检验方法,研究了统计方法的理论分布与性质,并通过R软件实施统计模拟和进行实际数据分析,数值结果均验证了我们所提出的检验方法具有某种稳健性.具体如下:在第三章中,本文推广了包含一个冗余参数的MERT检验到包含多个冗余参数的情形,并研究了包含多个冗余参数的MERT检验存在的一些正则条件及包含多个冗余参数MERT检验的一些统计理论性质.当多个基因位点连锁平衡且在基因遗传模型未知的情形下,本文推导了 MERT检验的具体形式,并研究其大样本性质.通过大量模拟研究,论证了这种检验对基因遗传模型未知具有稳健性.在第四章中,本文利用现代统计方法与数据分析技术提出了一种针对数据高维(大量基因位点)、哈代-温伯格平衡律成立与否未知、真实基因位点遗传模型未知都具有稳健性的统计检验方法,并将该方法应用在多个连锁不平衡位点的基因关联分析中,模拟研究与实际数据分析都证实了本文所提检验方法的稳健性.然后,在第五章中,本文初步探讨了基因关联分析中一种检测基因多效性的统计检验方法,提出了一种统计检验方法来检验二元有序离散取值的响应变量与连续取值的响应变量同时与一个协变量(向量)之间的关联性.当有序离散取值响应变量与连续取值响应变量的相关性不是很弱时,本文所提出的统计检验方法总是比传统的组合P-值检验方法功效更高.通过大量模拟研究与一个实际的医学数据分析证实了本文所提统计检验方法的优越性.最后,本文全面分析总结所开展研究工作的创新之处及主要优缺点,以及今后还要继续开展的一些研究工作.
【学位单位】:华中师范大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:Q811.4
【部分图文】:

基因,文献,走势图,交互作用


博士学位论文??DOCTORAL?DISSERTATION??呈逐年递增态势(详见图1.1).??1203??2005?2006?2007?2008?2009?2010?2011?2012?2013?2014?2015?2016??图1.1:有关GWAS综合研宄文献走势图?⑷基因-环境交互作用研宄文献;(b)基因-环境交互??作用研宄文献;(c)每篇文献涉及到的性状个数;(d)每篇GWAS文献涉及到的遗传性状分类数;??(e)每篇文献涉及到的GWAS分析数???1.1.2全基因组关联分析发展现状??2006年以来,随着人类基因组计划(The?Human?Genome?Project,简称HGP)和国际人类基因??组单体型图计划(The?International?HapMap?Project,简称HapMap计划)的相继完成,以及髙通量??基因分型技术的飞速发展,特别是近5年来F—代测序(Next-generation?sequencing,?NGS)技术的??出现和应用丨54],使GWAS向着更深更广的领域发展.当前GWAS的主要工作思路是针对全基因??组、外显子组或此前GWAS已识别的易感基因内部进行高通量测序及关联分析,进而在额外的独??立人群中验证,以期发现复杂疾病或性状的新的低频和罕见变异.在GWAS中,己经形了大量??的统计理论方法,我们将在下一节中详细介绍.??1.1.3?GWAS中典型案例介绍??2005年

结构图,连锁不平衡,基因,单倍体


被研宂过.为了得到多位点基因数据,通过使用HAPLOVIEW软件问来产生在单倍体型和对应??的频率分布.对于基因NAT2,我们选择等位基因频率MAFs?>?0.05且基因测序率2?75%总共??有18个SNPs.其连锁不平衡结构见图4.1,单倍体型和对应的频率分布见表4.1.?18个SNPs中的5??个?SNPs(编号:rsl3277605,?rsl79"3〇,?rsl2〇8,?rsl961456,?rs241〇556)为标签SNPs.??令丑代表其中一个单倍体型,表示单倍体型F所对应的频率,那么可以得到,??E/h?=?1.在模拟中,为了得到nQ个对照样本,首先在正常群体中哈代-温伯格平衡律下产生??^对单倍体(丑,这个单倍体对的频率有如下形式:当H?=丑',也=?/备;当丑#丑',??知&?=加加?为了得到屯个病例样本,我们按照如下频率产生一对单倍体??Tyli.HH1?includes?nAan)?nliHH1?includes?"aa"),??il?_?^Aa?^HH*??9HW?=?y,?includes?includes?

第一类错误,基因遗传,比率,位点


?15??The?Causal?SNP??图4.3:方法GOLD,?PChiP,?SSUP,?PChiB,?Min2的经验第一类错误比率.真实基因遗??传模型为可加模型.致病位点(横坐标表示每个位点依次指定为致病位点)对数优比1.0,??i^=0.51og⑵,基于所有18个SNPs,重复500次.??53??
【相似文献】

相关期刊论文 前10条

1 王身立;;转录调控水平上的基因多效性[J];遗传工程;1981年04期

2 喻磊 ,赵谨;Statin的基因多效性效应[J];日本医学介绍;2005年09期

3 ;科学问答[J];科学世界;2004年06期

4 闻立斗,史灵慧,徐国典,樊怡,王淑范,张静波;Charcot-Marie-Tooth氏病与遗传[J];中国神经精神疾病杂志;1984年01期

5 胡湘红;彭衡;杨灿;张纵辉;万翔;罗智泉;;基因大数据的集成分析[J];大数据;2019年04期

6 金万梅,尹淑萍;转基因植物释放的风险性和转基因植物食品安全性评价[J];西北农业学报;2002年04期

7 何颖;;家鸡血液生化遗传标记与产蛋相关性状间基因多效/连锁效应浅析[J];益阳职业技术学院学报;2004年01期

8 陈鹏辉;杨涛;;TBC1D24基因的致聋机制研究进展[J];中华耳科学杂志;2016年02期

9 张冬杰;杨国伟;刘娣;;猪雌激素受体基因(ESR)一个新多态位点的发现[J];遗传;2006年01期

10 何颖,杨建华;家鸡血液生化遗传标记与产蛋相关性状间基因多效/连锁效应浅析[J];湖南农业科学;2005年03期


相关博士学位论文 前3条

1 朱家砚;基因关联分析中若干稳健统计检验方法研究[D];华中师范大学;2018年

2 陈书强;粳稻直立穗型基因多效性及不同穗型品种品质粒位间差异的研究[D];沈阳农业大学;2008年

3 曾春平;基于全基因组双变量分析探索2型糖尿病与早期体重指标新的变异[D];南方医科大学;2017年


相关硕士学位论文 前3条

1 吴龙茂;银屑病与多种慢性炎症性疾病的基因多效性研究[D];安徽医科大学;2016年

2 陆亚平;基于代谢通路的水稻全表型组关联分析[D];华中农业大学;2016年

3 邓莹莹;利用大豆种间杂交(Glycine max × G.soja)剩余杂合系精细定位百粒重超显性位点qSWT_13_1[D];河北科技师范学院;2015年



本文编号:2841276

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2841276.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户50873***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com