疟原虫分子功能注释二级数据库的构建
发布时间:2017-10-16 21:33
本文关键词:疟原虫分子功能注释二级数据库的构建
更多相关文章: 疟原虫 功能注释 二级数据库 基因本体 通路 蛋白质与蛋白质相互作用
【摘要】:目的: (1)为了更好地对疟原虫分子机制研究过程中产生的实验数据进行分子功能注释分析,构建疟原虫分子功能注释数据库PlasmoFADB。 (2)开发一个数据注释结果界面友好直观,分析过程简便易行,相关数据库高度整合,平台扩展性较强的生物信息学分析平台,为疟原虫研究相关科研工作者提供良好的高通量数据分析工具和平台。 方法: (1)数据整合:PlasmoFADB数据库整合多物种多类型数据。从GenBank、 Uniprot、 PubMed中下载整合物种的基本信息,作为基础数据库,从KEGG、BioCarta、 NCI-PID数据库中下载整合物种的通路信息,从Gene Ontology下载基因本体信息,从dbSNP、DGV数据库中下载整合物种的变异信息,从Agilent、Illumina、Affymetrix官网上下载探针信息,从JASPAR、ITFP数据库中下载转录因子信息,从EPD数据库中下载启动子信息,从HPRD、MINT数据库中下载蛋白质与蛋白质相互作用信息,从nirBase、microma、EBI-MicroCosm、TargetScan数据库中下载miRNA及靶基因信息,将以上下载的原始数据经程序处理导入MySQL数据库中,以用于构建平台。 (2)功能注释:在GO2Gene、Pathway2Gene方向进行注释时,调用Fisher's精确概率检验算法程序实现对注释结果的富集分析或显著性分析。在对蛋白质相互作用结果(PPI)进行图形化描述时,调用Graphviz工具。 (3)平台实现:以Windows XP SP3为服务器,MySQL为底层数据库,根据解析后的数据进行数据表设计,采用Navicat for MySQL对数据库进行可视化管理。以Apache为网络服务器,使用MyEclipse等软件,基于J2EE技术和MVC的三层体系架构,以Java、JSP、HTML、XML、JavaScript、Ajax、Jquery Hibernate等语言或技术进行编程开发疟原虫分子功能注释平台及相关插件。 结果: (1)PlasmoFADB数据库设置多入口的分子注释类型,包括ProbeID、GenelD、 SwissProtID等。 (2)使GO以GOTree的注释形式展示,并对GO注释结果进行富集分析,用户可从中选出富集效果较好的数据进行下一步研究,支持注释结果的自由下载。 (3)图形化显示蛋白质与蛋白质相互作用结果,使其注释信息更加直观明了。 (4)注释分子在Pathway通路图上的快速定位及图形化显示,并对注释分子所影响的Pathway通路进行显著性分析,根据注释结果判断注释分子对通路的影响作用。 (5)PlasmoFADB数据库可对整合的部分物种进行启动子、转录因子、靶基因及变异信息注释。结论: (1)通过整合多种疟原虫虫株及模式生物的注释信息,构建一个可对疟原虫高通量生物实验数据提供快速有效注释的二级数据库PlasmoFADB。 (2)为表达谱芯片数据分析提供了一个快速高效的注释平台,为深入挖掘和理解模式生物和疟原虫分子机制研究中高通量数据生物学意义提供了有力的分析工具。 (3)本平台对疟原虫研究和模式生物表达谱数据分析有很大实用价值,可有效促进疟原虫基因功能、表达调控、通路等分子机制以及模式生物基因功能研究,也可以对疟原虫表达谱芯片探针的设计起到一定的参考作用。
【关键词】:疟原虫 功能注释 二级数据库 基因本体 通路 蛋白质与蛋白质相互作用
【学位授予单位】:北京协和医学院
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:R382.31;TP311.13
【目录】:
- 中文摘要5-7
- Abstract7-9
- 第一部分 前言9-19
- 1.1 生物信息学及生物信息数据库概述9-15
- 1.1.1 生物信息学概念9
- 1.1.2 生物信息学产生背景9-10
- 1.1.3 生物信息学主要研究内容10-13
- 1.1.4 生物信息数据库13-14
- 1.1.5 国内外生物信息数据库研究现状14-15
- 1.2 疟原虫分子机制研究面临的挑战15-16
- 1.3 生物信息学在疟原虫分子机制研究中的应用16-17
- 1.4 疟原虫分子功能注释二级数据库构建问题提出17-19
- 第二部分 材料19-25
- 2.1 聚合物种(虫株)信息19
- 2.2 聚合数据来源19-24
- 2.3 设备与软件24-25
- 第三部分 方法25-32
- 3.1 主框架构建25-27
- 3.2 数据解析27
- 3.3 数据库结构设计27-29
- 3.4 业务逻辑层实现29-31
- 3.5 结果展示层实现31-32
- 第四部分 结果32-41
- 4.1 PlasmoFADB分子功能注释界面32-33
- 4.2 注释结果展示33-41
- 4.2.1 注释分子基本信息33-34
- 4.2.2 染色体定位信息34
- 4.2.3 GO功能注释34-35
- 4.2.4 Pathway通路注释35-37
- 4.2.5 蛋白质与蛋白质相互作用网络37
- 4.2.6 启动子注释37-38
- 4.2.7 转录因子注释38
- 4.2.8 变异信息注释38-40
- 4.2.9 靶基因注释40-41
- 第五部分 分析与讨论41-44
- 5.1 PlasmoFADB提供面向科研实践的生物信息服务41
- 5.2 PlasmoFADB特点41-42
- 5.3 PlasmoFADB待完善之处42-44
- 5.3.1 数据库更新机制42-43
- 5.3.2 数据功能模块扩展43-44
- 第六部分 结论44-45
- 第七部分 参考文献45-50
- 第八部分 英文综述50-57
- References55-57
- 第九部分 附录(主要中英文对照表)57-60
- 第十部分 致谢60-61
【参考文献】
中国期刊全文数据库 前10条
1 王正华,王勇献;后基因组时代生物信息学的新进展[J];国防科技大学学报;2003年01期
2 毛源泽;韦芳萍;王俊美;刘强;;利用cvTree方法构建及分析tRNA序列的亲缘关系进化网络[J];基因组学与应用生物学;2011年04期
3 呼广跃,沈世镒;超级多重基因组序列比对算法[J];计算机工程与应用;2005年27期
4 陈琦;王卓;魏冬青;;代谢网络流分析进展及应用[J];科学通报;2010年14期
5 李晓华;邓伟;;基于数据集成的基因调控网络构建[J];计算机工程;2012年22期
6 朱伟民;朱云平;杨啸林;;生命科学信息工程设施以及在中国的实现[J];中国科学:生命科学;2013年01期
7 宋雪梅;李宏滨;杜立新;;比较基因组学及其应用[J];生命的化学;2006年05期
8 刘伟;朱云平;贺福初;;系统生物学研究中不同组学数据的整合[J];中国生物化学与分子生物学报;2007年12期
9 曹文君;李运明;陈长生;;基因表达谱富集分析方法研究进展[J];生物技术通讯;2008年06期
10 武妍;胡德华;;生物信息学跨学科研究[J];现代生物医学进展;2012年01期
,本文编号:1045047
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/1045047.html
最近更新
教材专著