当前位置:主页 > 医学论文 > 生物医学论文 >

生物分子结构与基因序列综合可视化数据组织管理方法研究

发布时间:2017-05-16 19:18

  本文关键词:生物分子结构与基因序列综合可视化数据组织管理方法研究,由笔耕文化传播整理发布。


【摘要】:随着系统生物学的兴起和迅速发展,为了探索不同生物层次或领域信息之间的关联关系,对不同层次生物数据综合可视化的需求日益迫切。近年来,生物学专家呼吁建立一种统一的集成框架,将不同层次和领域的可视化方式整合,实现生物数据的综合可视化,使研究人员可在生物的各层次间进行研究,可以洞察从基因、分子、细胞、器官甚至到整个生物体组织在内的整个过程。然而,传统的生物信息可视化工具大多是根据观察和分析某一类或某一层次实验数据的需求而研制,只能用于观察某一类独立实验的数据。例如,观察基因组序列、分子结构以及基因组比对的可视化软件都是独立的,用户难以用这些来研究不同层次和领域的生物数据之间的关联关系。因此,实现生物各层次数据的综合可视化这一美好蓝图,将是一个庞大的工程,将面临诸多技术挑战。本文面向最底层的生物分子结构和基因组序列数据的综合可视化应用需求,研究探讨分子领域与基因领域的综合可视化的关键技术。已有主流分子结构和基因组序列数据可视化方法得到了到专家的普遍接受,但数据表示方法相互独立,提取各领域数据间关联关系非常困难。研究解决不同层次的生物数据的组织管理问题,是实现真正意义上的综合可视化集成框架的基础和关键技术。本文重点研究了分子结构和基因组序列可视化数据对象特点,综合可视化元数据模型与生成方法,综合可视化数据管理模块系统结构,以及综合可视化数据组织管理模块实现技术等,完成的主要工作和取得的研究成果如下:1.在分析主流分子动力学模拟可视化工具和基因组序列可视化工具数据来源和数据特点基础上,面向分子结构和基因序列数据综合可视化的应用需求,提出了一种基因组序列和分子结构综合可视化元数据模型,通过定义包括分子结构、基因序列以及关联信息三类数据的元数据模型,建立了两个层次和领域数据的关联关系,确定了关联数据描述格式。为基因序列和分子结构数据综合可视化元数据生成,以及基因组序列和分子结构两类数据的综合集成管理提供了理论模型依据。2.面向分子结构和基因序列数据综合可视化数据管理需求,设计了一种具有工具数据管理、应用数据管理和综合服务管理功能的综合数据管理模块系统结构。工具数据管理可对工具文件库、文件数据库以及目录数据库进行统一管理;综合数据管理可对基因组序列可视化数据、分子结构可视化数据及其关联数据进行有效地组织管理;应用服务管理可对一般用户、项目用户、特权用户的数据访问权限等进行统一管理。该模块是综合可视化集成框架中数据组织管理的核心。3.针对基因组序列和分子结构可视化数据都是以规范格式的文本文件形式存储,难以支持综合可视化所需的细粒度数据操作的问题,提出一种基于XML的生物信息元数据生成方法。该方法先用XML语言对非结构化的文本可视化数据进行描述,将其中的元数据信息提取出来并转换为半结构化的XML文档形式;再根据预先定义的模板,将半结构化的XML数据转换为可以在关系数据库中存储的结构化数据形式。该方法以综合可视化元数据模型为依据、XML技术为手段实现了将难以操作的非结构文本数据转换为便于操作和管理的结构化关系型数据库数据,是实现综合可视化数据管理的关键技术。4.在上述研究工作和研究成果基础之上,设计实现一个分子结构和基因组序列数据综合可视化的数据组织管理模块并将该模块嵌入集成框架中,构建了一个分子结构和基因组序列数据综合可视化集成框架。利用该集成框架将已有的主流开源分子结构可视化软件工具VMD和主流开源基因组序列可视化软件工具JBrowse相集成,实现了一个分子结构和基因组序列数据综合可视化原型系统。该原型系统初步实现了几种综合可视化功能,取得了良好的实验效果,并验证了本文提出和设计的数据组织管理技术方法的合理性和有效性。
【关键词】:生物信息可视化 综合可视化 元数据模型 数据管理 集成框架
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:Q811.4

  本文关键词:生物分子结构与基因序列综合可视化数据组织管理方法研究,由笔耕文化传播整理发布。



本文编号:371704

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/371704.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b9f34***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com