人体宏基因组整合代谢网络的构建与分析
本文选题:人体 + 基因组 ; 参考:《中国人民解放军军事医学科学院》2016年博士论文
【摘要】:人体的各个部位(如肠道、口腔和皮肤等)生活着大量的微生物,这些微生物基因组的总和被称为宏基因组。人体内各种各样的微生物通过一系列相互关系构成了复杂的生态系统。然而,目前绝大多数的微生物是不能由实验室培养的,人们对这些微生物的信息知之甚少。许多研究表明了微生物群落与人体的疾病与健康存在着密切关系,微生物群落的动态变化会引起我们机体代谢和免疫功能的改变,最终可能导致多种疾病,如肥胖、克罗恩病和溃疡性结肠炎等。传统的对于人体内微生物的研究主要是通过实验室纯培养方式进行的,然而该方法严重受限于可培养微生物的数量太少,并且忽略了特定环境中丰度较低的微生物。宏基因组学(也被称为环境基因组学和群落基因组学)的出现彻底解决了这一问题,该方法不依赖于实验室培养技术,并且已经广泛应用于微生物群落的研究。宏基因组学研究初期,人们是利用毛细血管电泳测序或者PCR(Polymerase Chain Reaction)扩增的方法研究微生物群落,然而这些方法需要我们预先知道微生物群落信息,存在很多不足;随着新一代测序技术的出现和发展,使得宏基因组学研究更加全面,其灵敏度更高,应用更广泛,成本更低,可以帮助人们大规模的研究微生物之间以及它们与宿主之间的相互作用。当前对宏基因组的研究主要集中在分析宏基因组的结构组成,这种方法具有一定的片面性,忽略了大量微生物之间的相互关系。随着系统生物学的发展,近期有人提出了一种宏基因组整合代谢网络的方法来研究微生物群落,该方法整合了计算系统生物学方法和复杂网络理论,把整个微生物群落看成一个整体,利用代谢网络模型来分析基因组数据。通过分析复杂生物代谢网络的拓扑性质,可以得到生态系统的结构和功能信息,有助于我们理解观察到的生物表型,帮助我们从系统水平全面地研究人体微生物群落。首先是对微生物群落的整合代谢网络分析。利用系统生物学方法分析宏基因组的关键是代谢网络的重构,我们参考当前应用最广泛的KEGG代谢通路数据库来构建全局的参考代谢网络,随后基于MG-RAST平台对宏基因组的序列参考KEGG orthology (KO)进行注释,通过比较当前应用较广泛的基于拓扑的和基于约束的代谢网络构建方法的特性,发现基于拓扑的方法更适合于构建大规模的宏基因组整合代谢网络,所以我们选择基于拓扑的方法构建了全局参考代谢网络(3768个节点,81907个连边),其中节点代表了酶,有向边则代表了源节点参与生化反应的产物,可以作为目标节点参与的化学反应的底物;随后,我们利用该方法分析了8个不同健康状况(龋齿或者健康)的人口腔宏基因组样本,构建了一个由1009节点和18698条连边组成的整合代谢网络,分析功能注释数据估计每一个样本中的酶丰度,比较不同样本中酶丰度的差异,发现了293个与龋齿相关的酶,龋齿样本中高表达和低表达酶分别为147和146个;最后,计算口腔宏基因组的整合代谢网络的几个拓扑属性(如聚类系数),发现龋齿样本中低表达的酶与其它的酶相比,聚类系数较大,因此聚类系数可能作为一个预测龋齿致病机制的因子。此外,开发了宏基因组系统生物学分析平台mmnet,已经发布在生物信息学项目Bioconductor (http://www.bioconductor.org/packages/devel/bioc/ht ml/mmnet.html),它可以用来分析宏基因组数据,主要功能包括宏基因组序列的注释,酶丰度的估计,整合代谢网络重构,以及基于网络的拓扑分析和差异酶的计算,可以从系统水平对宏基因组进行研究,预测与疾病相关的因素。其次是对微生物群落的生态学研究。微生物群落的结构不仅包含了物种多样性信息,还且还反映了物种与它生活环境之间的关系。为了探究人体宏基因组群落中物种之间的相互关系,我们介绍了基于图论算法的反向生态学方法,基于基因组学数据对生物的生态进行研究,该方法的关键是如何把基因组信息转化为生态学信息,通过分析人体微生物群落的代谢网络,预测微生物与其生活环境之间的关系。我们用物种为了生存从其生活环境中获得的外源化合物来代表物种与环境之间的关系,并称这些化合物为物种的种子化合物(seed set)。为了验证seed set方法的可靠性,对人们研究较多的巴克纳氏菌进行研究,预测该物种的seed set包括25种化合物,其中9种化合物置信水平较高,这些种子化合物中包括葡萄糖(C00031:D-Glucose)和甘露醇(C00392:mannitol),以及2-同戊二酸(C00026:2-oxoglutarate),这与之前人们研究的结果是一致的,并根据每个物种与其环境之间的关联,定义了两个表示物种相互关系的系数(竞争因子和互补因子)。由于目前还没有功能全面的反向生态学分析工具,我们开发了R扩展包RevEcoR和web应用程序shiny-RevEcoR(http://yiluheihei.shinyapps.io/RevEcoR),它们界面友好,接口简单,便于扩展,用户可以很容易的从github上下载RevE coR (https://github.com/yiluheihei/RevEcoR)。首先利用它们分析了7种常见的口腔微生物,通过计算这7种微生物之间的竞争因子和互补因子,我们发现口腔链球菌和戈登链球菌之间有最大的竞争因子和最小的互补因子,所以它们之间主要是竞争关系,这也表明了这两种口腔微生物是对立的;其次对规模更大的人体肠道宏基因组进行分析,选择肠道样本中丰度大于1%的微生物进行分析,得到了116种已经有基因组信息的微生物,随后计算它们之间的相互关系,并与基于物种丰度信息计算的物种共生因子进行比较,我们发现竞争因子和共生因子是负相关的,而互补因子与共生因子无明显关系,因此我们预测肠道宏基因组中这些物种聚合的生态动力是竞争。以上分析充分表明了宏基因组系统生物学方法和反向生态学方法在人体微生物群落的研究中有巨大的应用潜力。
[Abstract]:Many researches have shown that microbial communities are closely related to diseases and health of human bodies . Many researches have shown that microbial communities are closely related to diseases and health of human bodies . However , there are many kinds of diseases , such as obesity , Crohn ' s disease and ulcerative colitis .
With the development of the new generation sequencing technology , the research of macrogenome is more comprehensive , the sensitivity is higher , the application is more extensive , the cost is lower , which can help people to study the interaction between microorganisms on a large scale .
Subsequently , we analyzed 8 human oral macrogenome samples of different health conditions ( dental caries or health ) using the method , constructed an integrated metabolic network composed of 1009 nodes and 18698 attached edges , and analyzed the difference of enzyme abundance in each sample , and found that 293 were related to dental caries , and the high expression and low expression enzymes in the samples were 147 and 146 , respectively ;
Finally , several topological properties ( such as clustering coefficient ) of integrated metabolic network of oral macro - genome are calculated , and compared with other enzymes , it can be used to study macro - genome data . The key of this method is to study the relationship between species and living environment . In order to verify the reliability of the seed set method , it was studied that the seed set of the species included 25 compounds , including glucose ( C00031 : D - Glucose ) and mannitol ( C00026 : 2 - oxopropionic acid ) , which were consistent with the results of previous studies . Since there were no comprehensive reverse ecological analysis tools , we developed R - extension package RevEcoR and web application Ser - RevEcoR ( https://github . com / yiluheihei / RevEcoR ) .
Secondly , we analyze the macro - genome of human intestinal tract with larger scale , select the micro - organisms whose abundance is more than 1 % in the intestinal sample , and then calculate the correlation between them . We find that there is negative correlation between the competition factor and the symbiotic factor , and the complementary factors have no obvious relation with the intergrowth factor , so we can predict that the ecological power of these species aggregation in the genome of the intestinal macrogenome is competitive . The above analysis shows that the biological method and the reverse ecological method of the macro - genome system have great potential for application in the study of human microbial community .
【学位授予单位】:中国人民解放军军事医学科学院
【学位级别】:博士
【学位授予年份】:2016
【分类号】:Q78
【相似文献】
相关期刊论文 前10条
1 赵蓉;胡永峰;金奇;;宏基因组学及其在医学微生物学领域的应用[J];病毒学报;2009年03期
2 宋培勇;马莉莉;王庆容;李黛;魏志琴;;宏基因组技术及其应用研究进展[J];贵州农业科学;2009年10期
3 孟飞;俞春娜;王秋岩;谢恬;;宏基因组与宏基因组学[J];中国生物化学与分子生物学报;2010年02期
4 刘海燕;常玉梅;;宏基因组学及在人体微生物研究上的应用[J];中国现代医学杂志;2012年08期
5 阎冰,洪葵,许云,马超;宏基因组克隆——微生物活性物质筛选的新途径[J];微生物学通报;2005年01期
6 欧敏功;崔晓龙;李一青;李铭刚;彭谦;文孟良;;宏基因组学在未培养微生物研究中的应用[J];微生物学杂志;2007年02期
7 艾芳芳;杨桦;曲媛媛;周集体;李昂;关晓燕;苟敏;;宏基因组研究及其应用研究进展[J];环境科学与技术;2007年12期
8 楚雍烈;杨娥;;宏基因组学及其技术的研究进展[J];西安交通大学学报(医学版);2008年06期
9 冯美琴;;宏基因组学的研究进展[J];安徽农业科学;2008年02期
10 李慧;何晶晶;张颖;徐慧;陈冠雄;;宏基因组技术在开发未培养环境微生物基因资源中的应用[J];生态学报;2008年04期
相关会议论文 前10条
1 阎冰;许云;马超;洪葵;;宏基因组克隆——微生物活性物质筛选的新途径[A];中国海洋生化学术会议论文荟萃集[C];2005年
2 张桂敏;王裔雄;胡勇;马立新;;一种简便快速构建宏基因组文库的方法[A];2008年中国微生物学会学术年会论文摘要集[C];2008年
3 黄雅丽;陆勇军;赖心田;张炯;林永成;周世宁;;南海微生物宏基因组文库的构建及功能基因初步筛选[A];微生物实用技术生态环境应用学术研讨会论文集[C];2008年
4 黄雅丽;李慧贤;张炯;杜纪坤;谭红铭;陆勇军;周世宁;;深海宏基因组文库筛选及新的功能基因[A];2010年第四届全国微生物遗传学学术研讨会论文摘要集[C];2010年
5 彭晴;张雪;关国华;李颖;;一个克隆自海洋底泥宏基因组文库的脂酶新基因[A];2008年中国微生物学会学术年会论文摘要集[C];2008年
6 代俊;江帆;彭方;方呈祥;;深海沉积物宏基因组文库中产甲壳素酶克隆的筛选[A];基因开启未来:新时代的遗传学与科技进步——湖北省遗传学会第八次代表大会暨学术讨论会论文摘要汇编[C];2009年
7 沈月毛;;通过构建宏基因组文库探讨植物美登木素生物合成起源[A];2008年中国微生物学会学术年会论文摘要集[C];2008年
8 谢福莉;陈大松;程国军;魏力;李友国;;通过宏基因组学途径研究参与氮素循环主要过程的相关功能新基因[A];2006年度学术研讨会论文摘要汇编[C];2006年
9 何彪;涂长春;;病毒宏基因组学的研究现状及应用[A];中国畜牧兽医学会兽医公共卫生学分会第三次学术研讨会论文集[C];2012年
10 牛泽;曾艳;王敏;杨慧;马荣才;高俊莲;;北京地区重金属污染土壤DNA提取及宏基因组文库构建[A];第十次全国环境微生物学术研讨会论文摘要集[C];2007年
相关重要报纸文章 前6条
1 记者 谭大跃 第五燕燕 实习生 栗洋洋;200余国际顶尖科学家聚深探讨宏基因组学[N];深圳特区报;2010年
2 记者 刘传书;我国科学家完成肠道微生物与Ⅱ型糖尿病的宏基因组关联分析[N];科技日报;2012年
3 王庆;宏基因组学:慧眼巧识微生物[N];工人日报;2014年
4 记者 熊燕;国际首例共生菌宏基因组文库在昆建成[N];云南日报;2009年
5 记者 杨婧如 通讯员 胡雯 刘佳;全球基因专家汇聚深圳话前沿[N];深圳特区报;2013年
6 通讯员 梁淡丽 记者 刘传书;中外科学家全方位分析全球微生物群落[N];科技日报;2011年
相关博士学位论文 前10条
1 高文渊;宏基因组来源酯酶基因的挖掘及其在非水相中催化性能的研究[D];华东理工大学;2016年
2 温燕;特发性间质性肺炎患者下呼吸道菌群结构研究[D];北京协和医学院;2016年
3 曹洋;人体宏基因组整合代谢网络的构建与分析[D];中国人民解放军军事医学科学院;2016年
4 邹晓辉;不明原因肺炎病例病原宏基因组学研究[D];中国疾病预防控制中心;2016年
5 苟敏;基于宏基因组的芳烃加氧酶获取及特性研究[D];大连理工大学;2011年
6 贺蕊;式根岛海绵宏基因组文库活性物质研究[D];重庆大学;2013年
7 常秦;宏基因组数据分析中的统计方法研究[D];山东大学;2012年
8 彭帅;应用宏基因组方法检测猪致病微生物及分析牛胃菌群组成[D];吉林大学;2015年
9 江夏薇;基于嗜耐盐菌基因组分析与深海宏基因组文库的酯酶研究[D];浙江大学;2013年
10 储新民;南海海洋微生物宏基因组文库中酯酶基因的筛选与鉴定[D];中国科学技术大学;2008年
相关硕士学位论文 前10条
1 覃千山;基于宏基因组的未培养互营烃降解菌‘Candidatus Smithella cisternae’的生物信息学研究[D];中国农业科学院;2015年
2 王伟;宏基因组学技术在病原体检测中的应用[D];安徽医科大学;2015年
3 周俊雄;天然木质纤维素降解机制的宏基因组学和宏蛋白质组学分析[D];福建师范大学;2015年
4 王兴兴;西藏开菲尔粒中优势菌的鉴定、分布与稳定性研究[D];上海海洋大学;2015年
5 邓云金;厌氧降解纤维素菌群的鉴定与发酵条件分析及其宏基因组文库构建[D];福建农林大学;2012年
6 赵文静;肠上皮特异性敲除自噬基因Atg5/Atg7小鼠肠道微生物宏基因组测序分析[D];上海交通大学;2015年
7 许悦;宏基因组读段组装融合与基因标注算法研究[D];湖南师范大学;2015年
8 胡资鹏;基于De Bruijn图的宏基因组序列组装算法研究[D];广西师范大学;2015年
9 汪俭;北黄海浮游病毒群落的宏基因组学研究[D];中国海洋大学;2015年
10 罗幸;宏基因组分类分析方法的研究和应用[D];东南大学;2015年
,本文编号:1738177
本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/1738177.html