宏基因组基因集构建方法及其应用研究
发布时间:2020-12-11 04:31
宏基因组学是研究环境中所有微生物基因组的学科,其主要的研究内容包括环境中的各类微生物种类和各种基因资源的功能,以期通过改变各类微生物比例促进宿主生物的健康生长或发掘有利功能基因应用于生产实践中。在前人研究的基础上,本研究利用公开数据库、开源生物信息软件和自行编写的C/C++和perl程序建立了一个完整的宏基因组基因集构建流程。相对于其他已发表的分析流程,本分析流程对组装之前的测序数据进行了更加严格的处理和检查,首次引入k-mer分析辅助算法,进而提高了后续宏基因组组装和基因预测的准确率。该流程不是固定的,可以根据研究项目数据量多少采用合适的中间分析步骤,以节省计算资源,同时得到正确的生物学结论。其中,针对占用内存最大的组装过程,我们尝试了多种组装策略,通过比较我们明确了各种策略的优缺点及其应用场景。该流程同时具有普适性,能用于不同的动植物或环境宏基因组分析。将此方法应用在鸡肠道宏基因组项目中,我们构建了第一个完善的鸡肠道微生物的基因集。该基因集完整度和人类、猪等动物的宏基因集相当。此外,基于该宏基因集,我们系统的研究了博落回提取物和常用的抗生素,金霉素,对鸡肠道微生物群落的影响。该肠道...
【文章来源】:中国农业科学院北京市
【文章页数】:49 页
【学位级别】:硕士
【部分图文】:
构建基因集分析流程图
图 3.1 鸡肠道不同肠段的结构Figure 3.1 Diagram of chicken intestinal tract.表 3.1. 鸡肠道微生物组样品Table 3.1 Samples of chicken gut metagenome饲 养地品种 饲 养 方式性别 山东 科宝 500 笼养 雌 雄 山西 罗斯 308 笼养 雌 雄 广东 矮脚黄鸡 放养 雌 雄 湖南 广西当地种 放养 雌 雄 河南 海兰褐壳蛋鸡 笼养 雌性 湖南 当地黄羽鸡 笼养 雌性
每一步都是必不可少的,而且要优化最终结果需要表 3.5 鸡肠道宏基因组基因预测结果统计Table 3.5 Statistics for gene prediction of chicken gut metagenom因数 基因数(> 102bp)所占比例(> 102 bp)完整基因数 完整比例 ,270 4,763,039 0.96 1,663,842 0.35 ,362 2,479,796 0.96 962,888 0.39 ,200 2,933,599 0.96 1,055,465 0.36 ,192 2,173,017 0.96 782,971 0.36 ,505 1,975,544 0.96 727,114 0.37 ,467 5,909,991 0.96 1,249,785 0.21 7,064 151,743 0.96 53,024 0.35 曲线分析表明曲线接近饱和(图 3.2),证明了大多该曲线的横轴表示样品的数目,纵轴表示基因的数中基因数目也随之增加,总样品曲线在样品数目增时增加样品并不会增加多少非冗余基因 同样,两表示不同种类鸡的特异微生物基因也基本都包含了
本文编号:2909910
【文章来源】:中国农业科学院北京市
【文章页数】:49 页
【学位级别】:硕士
【部分图文】:
构建基因集分析流程图
图 3.1 鸡肠道不同肠段的结构Figure 3.1 Diagram of chicken intestinal tract.表 3.1. 鸡肠道微生物组样品Table 3.1 Samples of chicken gut metagenome饲 养地品种 饲 养 方式性别 山东 科宝 500 笼养 雌 雄 山西 罗斯 308 笼养 雌 雄 广东 矮脚黄鸡 放养 雌 雄 湖南 广西当地种 放养 雌 雄 河南 海兰褐壳蛋鸡 笼养 雌性 湖南 当地黄羽鸡 笼养 雌性
每一步都是必不可少的,而且要优化最终结果需要表 3.5 鸡肠道宏基因组基因预测结果统计Table 3.5 Statistics for gene prediction of chicken gut metagenom因数 基因数(> 102bp)所占比例(> 102 bp)完整基因数 完整比例 ,270 4,763,039 0.96 1,663,842 0.35 ,362 2,479,796 0.96 962,888 0.39 ,200 2,933,599 0.96 1,055,465 0.36 ,192 2,173,017 0.96 782,971 0.36 ,505 1,975,544 0.96 727,114 0.37 ,467 5,909,991 0.96 1,249,785 0.21 7,064 151,743 0.96 53,024 0.35 曲线分析表明曲线接近饱和(图 3.2),证明了大多该曲线的横轴表示样品的数目,纵轴表示基因的数中基因数目也随之增加,总样品曲线在样品数目增时增加样品并不会增加多少非冗余基因 同样,两表示不同种类鸡的特异微生物基因也基本都包含了
本文编号:2909910
本文链接:https://www.wllwen.com/projectlw/swxlw/2909910.html
教材专著