当前位置:主页 > 医学论文 > 畜牧兽医论文 >

基于通路的全基因组关联分析策略应用于西门塔尔牛的初步研究

发布时间:2018-03-06 15:38

  本文选题:算法 切入点:西门塔尔牛 出处:《中国农业科学院》2015年硕士论文 论文类型:学位论文


【摘要】:随着人类全基因组计划的完成及高通量基因分型技术的快速发展,全基因组关联分析(GWAS)已经成为挖掘人类疾病易感基因及与家畜动物重要经济性状相关QTL的有力工具。大量以单核苷酸多态性片段(SNP)为主遗传标记已经被发现与人类疾病和家畜重要经济性状显著相关。然而,随着研究的深入,人们逐渐发现GWAS检测到的显著性SNP位点只能解释小部分与表型相关的变异,大量的剩余遗传信息还没有被挖掘。此外,大多数复杂的数量遗传性状往往由微效多基因决定的,单个SNP无法解释所有的表型变异。因此,需要提出新的统计策略来解决这种缺陷。在已有的众多策略中,基于通路的全基因组关联分析方法评估处于同一生物学通路中多个SNP的共同作用,而不仅仅单独的分析单个SNP的效应而广泛受到人们的关注。一些基于通路的关联分析算法也相继被提出,然而传统的基于通路的全基因组分析方法仅仅简单的使用显著的SNP构建基因统计量,忽视了小效应SNP的作用,这种策略有很大的局限性。为了解决传统的基于通路分析的算法缺陷,本研究提出了一种新的算法。这种算法包括两个步骤:1)使用主成分分析的思想构建每个基因的主成分矩阵,然后根据主成分与表型的关联程度对其进行排序。2)使用最大均值法(Maxmean)构建每个基因的统计量,然后使用柯尔莫哥罗夫-斯米尔诺夫(Kolmogorov-Smirnov)检验通路的显著性。基于来自内蒙古乌拉盖地区807头西门塔尔牛所包含的77,000,000 SNPs的数据,本研究使用新的算法对宰前活重、眼肌面积两个重要的经济性状进行了分析。结果表明,在对来自于KEGG数据库的263条通路的分析研究中,伽马氨基丁酸通路(p=0.000876)和非酒精性脂肪性肝病疾病(NAFLD)通路(p=0.000058)分别与宰前活重和眼肌面积两个性状显著相关。对两条显著性通路的生物信息学分析发现,伽马氨基丁酸通路已经被证实与动物的采食量及体重增加过程相关。本研究提出的基于通路的新算法首次剔除基因内部SNP之间的连锁作用,丰富了现有基于通路的全基因关联分析的算法。更重要的是,本项研究是首次对肉牛进行了基于通路的全基因组关联分析,共发现两条与肉牛重要经济性状相关的显著性通路。研究结果可能为后续实施分子育种提供重要的前提和基础。
[Abstract]:With the completion of the Human Genome Project and the rapid development of high-throughput genotyping technology, Genome-wide association analysis (GWAS) has become a powerful tool for mining human disease susceptibility genes and QTL associated with important economic traits in domestic animals. A large number of single nucleotide polymorphic fragments (SNPs) have been found to be associated with human genetic markers. Similar diseases are significantly associated with important economic traits in domestic animals. However, As the study progressed, it was gradually found that significant SNP loci detected by GWAS could only explain a small number of phenotypic variations, and that a large amount of residual genetic information had not yet been mined. Most complex quantitative genetic traits are often determined by microfunctional polygenes, and a single SNP cannot explain all phenotypic variations. Therefore, new statistical strategies are needed to address this defect. Pathway-based genome-wide association analysis was used to assess the interaction of multiple SNP in the same biological pathway. Not only the analysis of the effects of a single SNP has attracted widespread attention, but also a number of path-based association analysis algorithms have been proposed. However, the traditional genome-wide analysis method based on pathway simply uses significant SNP to construct gene statistics, neglecting the function of small effect SNP. This strategy has great limitations. In order to solve the shortcomings of traditional algorithms based on path analysis, This study proposes a new algorithm, which consists of two steps: 1) using the idea of principal component analysis (PCA) to construct a principal component matrix for each gene. And then sort it according to the association between the principal components and phenotypes. 2) using the maximum mean method Maxmean) to construct the statistics for each gene. Then using Colmogorov Smirnov Kolmogorov-Smirnov) to test the significance of the pathway. Based on the data of 77,000,000 SNPs from 807 Simmental cattle in Urage, Inner Mongolia, a new algorithm was used to measure the premortem weight. Two important economic traits of eye muscle area were analyzed. The results showed that, in the analysis of 263 pathways from KEGG database, The gamma-aminobutyric acid (GABA) pathway (0.000876) and the NAFLD (non-alcoholic fatty liver disease) pathway (p0.000058) were significantly correlated with pre-mortem weight and eye muscle area, respectively. The gamma-aminobutyric acid pathway has been shown to be related to animal intake and weight gain. It enriches the existing algorithms for the whole gene association analysis based on pathway. More importantly, this study is the first time that the whole genome association analysis based on pathway has been carried out in beef cattle. Two significant pathways related to important economic traits of beef cattle were found. The results may provide an important premise and basis for further implementation of molecular breeding.
【学位授予单位】:中国农业科学院
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:S823

【相似文献】

相关期刊论文 前10条

1 何忠武;;探讨鸡基因组在农业和医学中的潜在利用[J];中国畜禽种业;2013年11期

2 何忠武;;鸡基因组在生物学与农业和医学中的潜在利用[J];畜牧兽医杂志;2014年01期

3 程备久,凌杏元,,朱苏文;玉米基因组DNA的提取[J];安徽农业技术师范学院学报;1996年04期

4 王旭宁;;TRW数据寻查技术[J];生物技术通报;1990年04期

5 林毅;基因组错配扫描技术在疾病相关基因定位中的应用[J];基础医学与临床;1999年01期

6 李奎,蒋建桥,张木先,张锡元;猪基因组中存在C-myc和N-ras基因的初步证据[J];湖北农业科学;1994年03期

7 王继英;王海霞;迟瑞宾;郭建凤;武英;;全基因组关联分析在畜禽中的研究进展[J];中国农业科学;2013年04期

8 ;基因组测定介绍[J];新疆畜牧业;2011年06期

9 孙国凤;;James Watson向消极对待基因组分析的人发出警告[J];生物技术通报;1990年08期

10 徐明良,杨金水;YAC克隆——复杂基因组分析技术(综述)[J];农业生物技术学报;1997年01期

相关会议论文 前7条

1 施定基;;微藻系统组生物学的研究[A];中国海洋湖沼学会藻类学分会第七届会员大会暨第十四次学术讨论会论文摘要集[C];2007年

2 冯杰;王剑;唐兵;唐晓峰;;极端嗜盐古菌Natrinema sp.J7-2全基因组分析[A];2012年鄂粤微生物学学术年会——湖北省暨武汉微生物学会成立六十年庆祝大会论文集[C];2012年

3 冯杰;王剑;唐兵;唐晓峰;;极端嗜盐古菌Natrinema sp.J7-2全基因组分析[A];2012年第五届全国微生物遗传学学术研讨会论文摘要集[C];2012年

4 王红丹;吴东;张卉;秦利涛;廖世秀;;胎儿全基因组甲基化分析[A];第九届全国遗传病诊断与产前诊断学术交流会暨产前诊断和医学遗传学新技术研讨会论文集[C];2014年

5 乔军;孟庆玲;;单核细胞增生李斯特菌噬菌体[A];动物检疫学分会2010年学术年会论文集[C];2010年

6 唐北沙;;神经系统基因组病[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年

7 刘健;刘奇;黄玉屏;;嗜麦芽寡养单胞菌丝状噬菌体的生物学特征及基因组分析[A];2012年第五届全国微生物遗传学学术研讨会论文摘要集[C];2012年

相关重要报纸文章 前5条

1 薛严;迄今最大规模人类基因组分析完成[N];科技日报;2010年

2 记者 张梦然;迄今最详细的人类基因组分析数据出炉[N];科技日报;2012年

3 本报记者 吴m#麓;世界科学大战:破译癌症基因组[N];北京科技报;2010年

4 主持人 本报记者 胡其峰;“个体化基因组”的美妙与困惑[N];光明日报;2010年

5 深圳特区报记者 谭大跃 第五燕燕;不是哥伦布而是亚洲人发现了美洲[N];深圳特区报;2010年

相关博士学位论文 前6条

1 关巍;木质部难养菌(Xylella fastidiosa)基因组分析及特异性分子检测[D];中国农业科学院;2015年

2 金科;生物信息学在大熊猫和血吸虫基因组分析中的应用[D];复旦大学;2010年

3 杜瑾;基于基因组分析的VC发酵混菌体系共生机制及功能强化[D];天津大学;2013年

4 王芳平;密码对的使用与基因组进化[D];内蒙古大学;2009年

5 乌尼尔夫;中国马业综合数据库的建立及马基因组序列预测[D];内蒙古农业大学;2009年

6 蔡晓锋;番茄Dof基因家族全基因组分析及SlDof22、SlDHAR1和FaGalUR在AsA积累中的功能分析[D];华中农业大学;2014年

相关硕士学位论文 前9条

1 樊惠中;基于通路的全基因组关联分析策略应用于西门塔尔牛的初步研究[D];中国农业科学院;2015年

2 杨yN;单细胞全基因组技术的建立和评价[D];上海交通大学;2012年

3 付寅坤;超嗜热嗜压古菌Thermococcussp.LMO09A501生理研究及基因组分析[D];上海交通大学;2012年

4 张海强;以复杂多倍体植物为例的常规基因组分析流程搭建[D];浙江大学;2015年

5 成竞梁;转录因子结合位点和遗传病基因突变的全基因组分析[D];湖南科技大学;2012年

6 刘鲁鹏;瓜伊马斯热液口可培养Thermococcales的多样性研究及Pyrococcus yayanossi CH1的基因组分析[D];中国海洋大学;2011年

7 廖瑞奇;元基因组序列聚类算法研究[D];复旦大学;2013年

8 詹青;基于信息熵理论的基因组特性研究[D];哈尔滨工业大学;2011年

9 林文珍;深海微杆菌Microbacterium sediminis YLB-01耐压耐冷机理的初步分析[D];厦门大学;2014年



本文编号:1575441

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/dongwuyixue/1575441.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a8562***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com