微生物组大数据生态—进化融合可视化平台构建与算法研究

发布时间:2020-12-31 22:39
  随着新一代基因测序技术的高速发展,宏基因组的发展越来越快,传统生物实验难以满足宏基因组研究的需求,于是就需要借助计算机来完成后续的数据分析。由于宏基因组数据直观上,人类无法观察到任何信息,于是就需要一个足够好的可视化平台,使得微生物组数据能为我们人类所能阅读。本文完成了微生物组大数据进化生态融合可视化平台构建,用于做微生物数据分析。这里主要包括三个部分:可以与用户互动的基于的宏基因组可视化平台、基于进化树最优分割的有监督机器学习技术研究与微生物物种生态功能网络结构学习技术研究。宏基因组可视化平台的基本功能是对微生物组数据进行可视化,包括热图,系统发育树,物种群落构成,富集分析以及微生物群落多样性可视化,比起其它的宏基因组可视化平台,我们这一部分的特色是我们的工具可以通过筛选某些进化树的分枝,实现热图、进化树、物种群落构成图等同时一起改变为仅表现当前所选分支的信息,更方便于我们观察该分枝的信息。基于进化树最优分割的有监督机器学习技术研究与微生物生态功能网络结构学习技术研究,是两种用于从微生物数据中提取特征用于后续机器学习的方法。我们将它同时整合到我们的平台里。基于进化树优分割的有监督机器... 

【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 引言
    1.1 研究背景与研究意义
        1.1.1 研究背景
        1.1.2 宏基因组学分析的基本流程
        1.1.3 研究意义
    1.2 国内外相关领域研究现状
        1.2.1 可视化工具部分
        1.2.2 机器学习与进化树相关部分
    1.3 本文研究目标与研究内容
        1.3.1 研究目标
        1.3.2 研究内容
        1.3.3 论文内容安排
第2章 宏基因组可视化平台
    2.1 概览
    2.2 统计部分
        2.2.1 基本的统计方法
        2.2.2 富集分析
    2.3 可视化部分
        2.3.1 热图
        2.3.2 系统发育树
        2.3.3 物种群落构成图
        2.3.4 互动过程
        2.3.5 微生物群落多样性可视化
    2.4 机器学习部分
    2.5 具体实现
第3章 基于进化树最优分割的有监督机器学习技术研究
    3.1 方法
        3.1.1 进化树分割成多棵子树
        3.1.2 对子树使用贪心算法来搜索最优分割
        3.1.3 生成新的OTU table
    3.2 实验
        3.2.1 实验方法的参数设置
        3.2.2 实验数据与评测标准
        3.2.3 已有的代表方法(baseline)
第4章 微生物物种生态功能网络结构学习技术研究
    4.1 计算分布相似关系矩阵
    4.2 构建网络
    4.3 谱聚类
    4.4 划分网络模块以及计算基于模块的表达矩阵
    4.5 实验
第5章 总结与展望
    5.1 总结
    5.2 展望
附录A 网站页面
参考文献
作者简历及攻读学位期间发表的学术论文与研究成果
致谢


【参考文献】:
期刊论文
[1]基于网络嵌入方法的肠道微生物组大数据网络分析[J]. 李倩莹,蔡云鹏,张凯.  集成技术. 2019(05)



本文编号:2950441

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2950441.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e5de3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com