当前位置:主页 > 医学论文 > 西医药论文 >

全基因组关联研究中的两阶段设计与分析

发布时间:2018-08-04 15:57
【摘要】:全基因组关联研究作为一种发现复杂疾病易感基因的重要工具,已经帮助科学家们成功地找到了数干个与多种人类疾病相关联的遗传变异(单核苷酸多态性)。相较于一阶段设计(对全部病例和对照样本测序全部的位点),合理构建的两阶段设计(第一阶段从所有的病例-对照样本中选出一部分样本进行全部位点的测序,根据关联检验的结果选择一小部分最显著的位点进入第二阶段并在余下的样本上进行测序)能够大幅度地降低测序工作量和费用因此成为全基因组关联研究中一种常用的方法。对每个阶段的数据分开进行考查的重复分析方法常常会损失检验功效,已经有学者提出了组合两个阶段的检验统计量的联合分析策略以提高统计功效。现有的联合分析方法都是根据一个假定已知的遗传模型来构造检验统计量,但在实际中与疾病关联的单核苷酸多态性位点服从的遗传模型通常是未知的即遗传模型具有不确定性,如果假定的遗传模型不正确就可能会导致不稳健的功效表现。 本文围绕两阶段设计下全基因组关联研究中稳健的单位点联合分析方法展开研究,主要包括以下三个分专题。(1)针对次要等位基因频率大于5%的常见遗传变异,我们提出了基于两个稳健检验统计量—最大最小效率的稳健检验(MERT)和MAX3检验(隐性、显性、可加遗传模型下计算的趋势性检验统计量绝对值的最大值)—的联合分析方法,得到了MERT联合分析检验统计量的大样本渐近分布形式并给出了计算MAX3联合分析方法p值和功效的一种高效可行的参数Bootstrap方法。通过大量的模拟研究对MAX3联合分析方法、MERT联合分析方法及重复分析方法、基于可加模型的趋势性检验统计量的联合分析方法及重复分析方法、基于等位基因检验统计量的联合分析方法及重复分析方法进行了统计功效的比较,数值结果表明联合分析的功效普遍地高于重复分析且MAX3联合分析方法具有最好的表现。对一项研究Ⅱ型糖尿病的实际数据进行了分析,利用MAx3联合分析方法计算的p值报告了一个新的风险单核苷酸多态位点。(2)针对次要等位基因频率小于5%的稀有变异,我们提出了基于Beta检验的重复分析方法和联合分析方法。给出了Beta检验的p值渐近服从标准均匀分布的理论证明。通过模拟比较了重复分析和联合分析的第一类错误率和功效,结果表明两种方法都能很好地控制第一类错误率,联合分析比重复分析具有更高的功效。将提出的两种方法用于风湿性关节炎的实际数据分析,证实了所考察的单核苷酸多态位点与风湿性关节炎有着显著的关联。 (3)我们基于渐近贝叶斯因子提出了一种稳健的两阶段贝叶斯分析方法,并定义了检定概率来评价渐近贝叶斯因子排序方法的优劣。通过模拟比较了最大渐近贝叶斯因子联合分析方法、遗传模型平均渐近贝叶斯因子联合分析方法、可加模型渐近贝叶斯囚子联合分析方法的检定概率,结果表明最大渐近贝叶斯因子联合分析方法的表现最为稳健。对一组实际数据的分析结果表明最大渐近贝叶斯因子排序方法能够有效地检测到隐性或显性模型的单核苷酸多态性位点与疾病之间的关联。 全文共分为六章。第一章是引言,介绍若干基本概念和研究背景;第二章是预备知识,介绍全基因组关联研究中一些常用的统计量和检验方法;第三章讨论常见遗传变异的两阶段设计与分析;第四章研究稀有遗传变异的两阶段设计与分析;第五章讨论基于渐近贝叶斯因子的两阶段设计与分析;第六章是总结以及对未来工作的展望。
[Abstract]:Whole genome association, an important tool for finding the susceptible genes of complex diseases, has helped scientists successfully find a number of genetic variants associated with a variety of human diseases (single nucleotide polymorphisms). Compared to one stage design (all cases and control samples are sequenced in all loci), two of them are reasonably constructed. Phase design (the first phase selected a part of the case - control sample to sequence all the sites, select a small portion of the most significant loci to enter the second stage and sequence on the remaining samples according to the results of the association test), which can greatly reduce the workload and cost of sequencing and thus become the whole genome. A commonly used method in association studies. Repeated analysis of data separately examined at each stage often loses the effectiveness of the test. Some scholars have proposed a combined analysis strategy of combining two stages of test statistics to improve the statistical efficiency. The existing joint analysis methods are based on a hypothesis known. The model is used to construct the test statistics, but the genetic model that is subordinate to the single nucleotide polymorphic loci in the actual disease is usually unknown, that is, the genetic model is uncertain. If the assumed genetic model is incorrect, it may lead to unrobust performance.
This paper focuses on the robust unit point joint analysis method in the two stage design of whole genome research, including the following three sub topics. (1) we propose a robust test (MERT) and MAX based on the measurement of the secondary allele more than 5%, based on the measurement of the maximum and minimum efficiency of the two robust test series. 3 test (recessive, dominant, the maximum of the absolute value of the trend test statistics calculated under the genetic model) - the joint analysis method, obtains the large sample asymptotic distribution of the MERT joint analysis test statistics and gives a efficient and feasible parameter Bootstrap method for calculating the p value and the work effect of the joint analysis method of the MAX3. A large number of simulated studies on MAX3 joint analysis, MERT joint analysis and repeated analysis, joint analysis and repeated analysis based on additive model trend test statistics, and comparison of statistical efficacy based on the combined analysis method and repeated analysis method based on allele test statistics, and numerical results. The effectiveness of the combined analysis was generally higher than repeated analysis and the MAX3 combined analysis had the best performance. An analysis of the actual data of a study of type 2 diabetes was carried out. A new risk single nucleotide polymorphisms were reported by the p value calculated by the MAx3 combined analysis. (2) the frequency of secondary alleles was less than 5%. In rare variations, we propose a Beta test based repeated analysis method and a joint analysis method. The theoretical proof that the p value of the Beta test is asymptotically obeying the standard uniform distribution is given. The first class error rate and efficiency of the repeated and joint analysis are compared by simulation. The results show that the two methods can control the first type of error well. The combined analysis was more effective than repeated analysis. The two methods proposed in this study were used to analyze the actual data of rheumatoid arthritis. It was confirmed that the single nucleotide polymorphisms were significantly associated with rheumatoid arthritis.
(3) based on the asymptotic Bias factor, we propose a robust two stage Bias analysis method, and define the detection probability to evaluate the asymptotic Bias factor ranking method. By comparing the maximum asymptotical Bias factor combined analysis method, the genetic model average asymptotic Bias factor joint analysis method can be added. The results show that the maximum asymptotic Bias factor combined analysis method has the most robust performance. The analysis of a group of actual data shows that the maximum asymptotic Bias factor sorting method can effectively detect the single nucleotide polymorphic loci of the recessive or dominant model and the single nucleotide polymorphic loci of the hidden or dominant model. The association between diseases.
The full text is divided into six chapters. The first chapter is introduction, introduces some basic concepts and research background. The second chapter is preparatory knowledge, introduces some common statistics and test methods in the study of whole genome association; the third chapter discusses the two stage design and analysis of common genetic variation; the fourth chapter studies the two phase design of rare genetic variation. Chapter 5 discusses two-stage design and analysis based on asymptotic Bayesian factors; Chapter 6 is a summary and outlook for future work.
【学位授予单位】:云南大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:R346

【相似文献】

相关期刊论文 前10条

1 区宝娇;不合理用药分析[J];新医学;1989年09期

2 Varro E.Tyler;张治针;;药用植物的研究[J];江西中医学院学报;1991年02期

3 聂波;刘勇;徐青;梁鑫淼;肖培根;;地参反相高效液相色谱分析方法的建立[J];世界科学技术-中医药现代化;2006年01期

4 张秋菊;崔世勇;;水中痕量铁分析进展[J];中国卫生检验杂志;2007年07期

5 潘俊杰;郑琴;杨明;;三七中三七总皂苷的提取、分离纯化及分析方法的研究进展[J];世界科学技术-中医药现代化;2007年06期

6 何涛;张岚;鄂学礼;;饮用水中二氧化氯及其消毒副产物分析方法研究进展[J];国外医学(卫生学分册);2008年02期

7 吴剑威;杨美华;高微微;赵润怀;;镰刀菌毒素分析方法研究进展[J];中草药;2008年04期

8 郑勤云;朱智碧;;癌症患者麻醉药品用药调查与分析[J];中国药业;2008年12期

9 刘福艳;李军;谢元超;刘福强;;中成药中非法添加化学药品的现状与分析检测对策[J];中国药事;2008年12期

10 欧灿纯;;2008年我院门诊第二类精神药品的使用与分析[J];广西医学;2009年10期

相关会议论文 前10条

1 于辉;刘洋;;应急物资的两阶段局内分配策略[A];经济全球化与系统工程——中国系统工程学会第16届学术年会论文集[C];2010年

2 郑青山;杨娟;;不同实验数据合并分析方法[A];定量药理研究方法学培训班讲义[C];2010年

3 马蔚;;锰的分析方法进展[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年

4 顾昌明;;关于复配农药分析方法的探讨[A];江苏省农药学术研讨会论文集[C];1997年

5 陆启亮;翟永梅;;两阶段MPA法的改进研究[A];上海防灾救灾研究所20周年庆典会议研究短文集[C];2009年

6 石锋;;语音格局的分析方法[A];第六届全国现代语音学学术会议论文集(上)[C];2003年

7 邵国建;苏静波;;区间可靠性分析方法及在地下隧道结构计算中的应用[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年

8 叶钟;;汽轮机调速系统的一些设计思想和分析方法[A];中国动力工程学会成立四十周年文集[C];2002年

9 孙严荣;闻章辉;乔志;范胜槐;;利用NaOAC—EDTA—NaOH煮沸浸提比色法估测中性土壤有机质含量[A];江苏土壤肥料科学与农业环境[C];2004年

10 张雪莲;蔡莲珍;仇士华;;生物体中~(13)C、~(15)N的分析方法[A];第三届全国现代生物物理技术学术讨论会论文摘要汇编[C];2000年

相关重要报纸文章 前10条

1 赵俊豪;质量经济效益分析方法种种[N];中国质量报;2008年

2 晓王;市场发生了转折 分析方法也会变[N];黄山日报;2006年

3 meiying88;股票分析贵在专一而不在多[N];上海证券报;2007年

4 何泳涛;初入市者应重视技术分析[N];期货日报;2008年

5 柴宁;处处留心皆学问[N];期货日报;2007年

6 大时代投资 胡红霞;权证投资之分时K线技巧[N];证券日报;2005年

7 黄永忠;现行短期偿债能力分析方法的缺陷[N];中国财经报;2002年

8 ;石油开采废水回注应达到《碎屑盐油藏注水水质推荐指标及分析方法》规定的标准[N];中国环境报;2005年

9 郑武;瓦楞纸箱设备电气故障检查和分析方法[N];中国包装报;2006年

10 曹健美;企业会计报表分析方法刍议[N];中国城乡金融报;2002年

相关博士学位论文 前10条

1 潘东东;全基因组关联研究中的两阶段设计与分析[D];云南大学;2012年

2 蒋爱华;泛(火用)分析方法及其应用研究[D];中南大学;2011年

3 任曼;环境与生物样品中PCDD/Fs和DL-PCBs的分析方法与环境行为初步研究[D];中国科学院研究生院(广州地球化学研究所);2006年

4 陈福南;高效液相色谱—化学发光分析研究[D];西南大学;2008年

5 李剑;大气中羰基化合物PFPH/GC/MS分析方法的建立及其应用[D];上海大学;2009年

6 王玉t,

本文编号:2164377


资料下载
论文发表

本文链接:https://www.wllwen.com/xiyixuelunwen/2164377.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a74b1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com