儿童肿瘤多组学大数据分析平台

发布时间:2021-12-24 10:14
  肿瘤是成人和儿童死亡的主要原因,但相对而言,大多数儿童肿瘤是比较罕见的疾病。Therapeutically Applicable Research To Generate Effective Treatments(TARGET)数据库已经释放了多种儿童肿瘤的多组学数据以及临床数据。这些数据为挖掘儿童肿瘤发展相关分子机制创造了条件。然而,由于组学数据具有存储量大,维度高等特点,对无生物信息学背景的研究人员而言门槛较高且难以使用,极大地限制了多组学数据在儿童肿瘤中的应用。此外,目前很少有专门针对儿童肿瘤数据分析的平台,为无生物信息科研背景或编程能力薄弱的研究人员使用。因此,本课题开发了儿童肿瘤多组学大数据分析平台,通过Web Server的形式进行展示。基于来自GEO、TARGET、SRA数据库中的多种儿童肿瘤的不同组学数据,提供了多种定制化的分析功能,包括基因基本信息查询、基因差异表达分析、甲基化差异分析、多组学关联分析、相似基因计算检测、患者生存分析、肿瘤免疫细胞浸润程度分析。本平台针对儿童肿瘤数据进行了多方位的分析,为相关的研究人员提供全面、简洁的数据挖掘功能,致力于将多组学应用于儿... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:88 页

【学位级别】:硕士

【部分图文】:

儿童肿瘤多组学大数据分析平台


TARGET数据库数据类型

流程图,大数,肿瘤,儿童


华东师范大学硕士学位论文6度分析模块。对于可以提前进行分析计算的数据,我们会提前通过程序脚本计算出分析结果,并存储在本地的MySQL数据库中。本文旨在开发常用的数据分析功能,对数据挖掘进行可视化,使得更多的研究人员通过简单的操作就能实现复杂的数据分析。儿童肿瘤多组学大数据分析平台的系统架构如图1-2所示,整个系统的工作流程如下,前期先进行数据收集工作,分别从TARGET、GEO以及SRA数据库中下载了儿童肿瘤的不同组学的数据和临床数据,因为来自不同数据库中的原始数据存储的格式存在差异,所以需要对数据进行统一的标准化,然后对数据进行清洗,过滤掉RNA-Seq数据中低丰度的基因以及甲基化芯片中包含大量缺失值的位点,最后对数据进行预处理工作,将数据整理成后续分析可用的输入格式。数据处理好后,下一步便是进行数据分析、数据挖掘,最后开发网站平台进行结果展示。图1-2儿童肿瘤多组学大数据分析数据库平台的构建流程图在数据分析的模块中,我们做了在肿瘤癌症研究中常用的数据分析,如基因表达的差异分析、甲基化的差异分析、肿瘤免疫浸润程度分析、多组学关联分析、相似基因检测以及生存分析等。最终并开发成Web平台,Web平台的设计理念一切从简,为了让不会编程的科研人员也能够快速的做肿瘤癌症相关的交互式数据分析,网站上按照分析的功能模块进行划分。系统的数据处理和数据展示的架

架构图,大数,儿童,分析数据


华东师范大学硕士学位论文7构如图1-3,原始数据通过数据计算层得到分析结果存储在数据层中,然后通过逻辑层的操作将分析结果通过表格以及矢量图的形式展现在视图层中。网站中的所有绘图功能都是使用R脚本开发的,网站的输出包括表格和图表。网站中的静态数据可视化主要是通过便携式文档格式(PDF)进行呈现。图1-3儿童肿瘤多组学大数据分析数据库的架构与此同时,本文完成了儿童肿瘤多组学大数据分析平台的网站开发,开发了多种交互式的数据分析功能,并且提供定制化的绘图功能。网站主要提供了7个模块:基因基本信息查询模块,基因表达差异分析模块,甲基化差异分析模块,多组学关联分析模块,肿瘤临床生存分析模块,相似基因计算检测模块,肿瘤免疫细胞浸润程度分析模块。儿童肿瘤多组学大数据分析平台网站免费提供给所有用户,前端是基于HTML5和JavaScript库(https://jquery.com/)和Bootstrap模板(https://www.bootcss.com/)进行开发,数据可视化基于ECHARTS库


本文编号:3550299

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3550299.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5021e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com