基因转录调控模体预测的研究及其在线服务开发
发布时间:2017-04-04 07:40
本文关键词:基因转录调控模体预测的研究及其在线服务开发,由笔耕文化传播整理发布。
【摘要】:生物信息学的发展提出了很多计算问题,通过计算方法预测基因的转录调控模体是其中之一。模体(motif)是一组短片段,通常只有8-12个字符的长度。因为具有生物功能,所以相对于生物序列的其他部分不易改变。它具有序列保守性,可以在序列上识别。依据所研究的生物序列不同,模体可分为DNA模体,蛋白质模体和结构模体,,本文工作主要是研究载有基因转录调控功能的DNA模体。它可以帮助生命科学研究者了解基因转录的调控机制,为药物和生物工程等多个领域做出贡献,为计算科学的研究者提供了研究热点。传统的转录模体预测问题是多序列比对的NP复杂问题,之前的预测算法大都基于启发式学习方法,实际运用的假阳性率较高。很多生物信息工具需要较低假阳性率,才能在生物研究中被有效使用。实验组之前开发的BoBro模体识别算法[46]可以有效解决这一问题,它通过模体信号之间的相互支持,在数据处理内部降低其他“噪音”影响的同时保证了预测的识别率。目前主流的模体识别算法(如meme[39])都实现了在线服务。为了推广该方法,本人的研究工作就是以此算法为基础,通过增加结果分析功能,在高性能集群上设计实现了web服务平台DMINDA(http://csbl.bmb.uga.edu/DMINDA/)。 DMINDA的主要贡献在于:(1)对于给定查找到的一组调控序列和相应的对照序列,可以计算得到统计打分以及对应的统计显著p-value;(2)除了实现BoBro算法[46]对模体的预测,还对预测结果的进一步分析提供了模体扫描、比较、共作用分析等功能;(3)服务还实现了同DOOR原核生物操纵子数据库的链接,利用操纵子信息提取调控序列,结合生物系统发生关系准备数据。 设计DMINDA系统除了具有实际软件开发能力,还需要了解相关研究的领域的知识,才能了解用户的切实需求。生物信息学研究领域开发了很多工具没有充分发挥其应有价值,结合实际需要利用web开发技术制作出有实用意义的在线服务,可以推广这些方法。科学研究成果通过web技术向广大科研使用者推广是计算机应用领域的重要研究方向,有人将之称为科学2.0。DMINDA在实验组之前工作的基础上,增加了后续分析工作的研究工具,通过对核心算法的重编程和再组织,实现了在150节点高性能计算集群的部署。利用DataTables等Jquery工具,设计了界面友好的操作页面。以该平台为基础,继续开发了基于生物系统发生关系的MP3模体预测算法和在全基因组预测调控子的方法,目前正在投稿。利用web服务推广科研成果,可以提高论文发表层次,增加论文的引用次数,它可以成为一系列后续研究的平台。本文回顾了模体的预测及其相关研究,介绍了DMINDA系统的设计、开发与运行。
【关键词】:生物息学 web服务开发 调控模体预测 基因转录 高性能集群
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q78;TP393.09
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-20
- 1.1 研究目的与意义10-11
- 1.2 国内外研究现状分析11-18
- 1.2.1 基因转录调控11-14
- 1.2.2 确定调控模体的实验技术14-15
- 1.2.3 转录调控模体的信息学研究15-17
- 1.2.4 主要模体计算预测分析平台和工具17-18
- 1.3 本文的主要工作和主要结构18-20
- 第2章 系统实现的模体识别与分析20-34
- 2.1 模体的表示方法22-24
- 2.2 模体识别功能的算法24-29
- 2.3 模体扫描功能的算法29-30
- 2.4 模体比较功能的算法30-31
- 2.5 转录模体共调控分析的计算31-32
- 2.6 数据的准备32-33
- 2.7 算法和流程的并行化33-34
- 第3章 系统的开发34-57
- 3.1 系统的配置及开发技术34-43
- 3.1.1 系统的硬件配置和运行管理34-38
- 3.1.2 系统的开发工具38-41
- 3.1.3 系统的页面开发技术41-43
- 3.2 系统的架构分析43-46
- 3.2.1 用户数据的需求44-45
- 3.2.2 网页服务的需求45
- 3.2.3 数据服务的需求45
- 3.2.4 计算集群服务的需求45-46
- 3.2.5 邮件服务的需求46
- 3.3 系统的功能实现46-57
- 3.3.1 系统的设计架构46-48
- 3.3.2 页面的实现48-53
- 3.3.3 系统与服务器接口的实现53-54
- 3.3.4 其他主要程序的实现54-57
- 第4章 系统的应用和性能分析57-65
- 4.1 预测大肠杆菌三羧酸循环的调控模体57-60
- 4.2 网站的使用性能60-65
- 第5章 结论和展望65-67
- 5.1 结论65-66
- 5.2 展望66-67
- 参考文献67-71
- 作者简介及在学期间所取得的科研成果71-72
- 致谢72
【参考文献】
中国期刊全文数据库 前1条
1 冉令华,阮晓钢;大肠杆菌启动子特征元件对启动子识别的影响[J];北京工业大学学报;2005年02期
中国博士学位论文全文数据库 前1条
1 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
本文关键词:基因转录调控模体预测的研究及其在线服务开发,由笔耕文化传播整理发布。
本文编号:285112
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/285112.html