当前位置:主页 > 管理论文 > 移动网络论文 >

基因转录调控模体预测的研究及其在线服务开发

发布时间:2017-04-04 07:40

  本文关键词:基因转录调控模体预测的研究及其在线服务开发,由笔耕文化传播整理发布。


【摘要】:生物信息学的发展提出了很多计算问题,通过计算方法预测基因的转录调控模体是其中之一。模体(motif)是一组短片段,通常只有8-12个字符的长度。因为具有生物功能,所以相对于生物序列的其他部分不易改变。它具有序列保守性,可以在序列上识别。依据所研究的生物序列不同,模体可分为DNA模体,蛋白质模体和结构模体,,本文工作主要是研究载有基因转录调控功能的DNA模体。它可以帮助生命科学研究者了解基因转录的调控机制,为药物和生物工程等多个领域做出贡献,为计算科学的研究者提供了研究热点。传统的转录模体预测问题是多序列比对的NP复杂问题,之前的预测算法大都基于启发式学习方法,实际运用的假阳性率较高。很多生物信息工具需要较低假阳性率,才能在生物研究中被有效使用。实验组之前开发的BoBro模体识别算法[46]可以有效解决这一问题,它通过模体信号之间的相互支持,在数据处理内部降低其他“噪音”影响的同时保证了预测的识别率。目前主流的模体识别算法(如meme[39])都实现了在线服务。为了推广该方法,本人的研究工作就是以此算法为基础,通过增加结果分析功能,在高性能集群上设计实现了web服务平台DMINDA(http://csbl.bmb.uga.edu/DMINDA/)。 DMINDA的主要贡献在于:(1)对于给定查找到的一组调控序列和相应的对照序列,可以计算得到统计打分以及对应的统计显著p-value;(2)除了实现BoBro算法[46]对模体的预测,还对预测结果的进一步分析提供了模体扫描、比较、共作用分析等功能;(3)服务还实现了同DOOR原核生物操纵子数据库的链接,利用操纵子信息提取调控序列,结合生物系统发生关系准备数据。 设计DMINDA系统除了具有实际软件开发能力,还需要了解相关研究的领域的知识,才能了解用户的切实需求。生物信息学研究领域开发了很多工具没有充分发挥其应有价值,结合实际需要利用web开发技术制作出有实用意义的在线服务,可以推广这些方法。科学研究成果通过web技术向广大科研使用者推广是计算机应用领域的重要研究方向,有人将之称为科学2.0。DMINDA在实验组之前工作的基础上,增加了后续分析工作的研究工具,通过对核心算法的重编程和再组织,实现了在150节点高性能计算集群的部署。利用DataTables等Jquery工具,设计了界面友好的操作页面。以该平台为基础,继续开发了基于生物系统发生关系的MP3模体预测算法和在全基因组预测调控子的方法,目前正在投稿。利用web服务推广科研成果,可以提高论文发表层次,增加论文的引用次数,它可以成为一系列后续研究的平台。本文回顾了模体的预测及其相关研究,介绍了DMINDA系统的设计、开发与运行。
【关键词】:生物息学 web服务开发 调控模体预测 基因转录 高性能集群
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q78;TP393.09
【目录】:
  • 摘要4-6
  • Abstract6-10
  • 第1章 绪论10-20
  • 1.1 研究目的与意义10-11
  • 1.2 国内外研究现状分析11-18
  • 1.2.1 基因转录调控11-14
  • 1.2.2 确定调控模体的实验技术14-15
  • 1.2.3 转录调控模体的信息学研究15-17
  • 1.2.4 主要模体计算预测分析平台和工具17-18
  • 1.3 本文的主要工作和主要结构18-20
  • 第2章 系统实现的模体识别与分析20-34
  • 2.1 模体的表示方法22-24
  • 2.2 模体识别功能的算法24-29
  • 2.3 模体扫描功能的算法29-30
  • 2.4 模体比较功能的算法30-31
  • 2.5 转录模体共调控分析的计算31-32
  • 2.6 数据的准备32-33
  • 2.7 算法和流程的并行化33-34
  • 第3章 系统的开发34-57
  • 3.1 系统的配置及开发技术34-43
  • 3.1.1 系统的硬件配置和运行管理34-38
  • 3.1.2 系统的开发工具38-41
  • 3.1.3 系统的页面开发技术41-43
  • 3.2 系统的架构分析43-46
  • 3.2.1 用户数据的需求44-45
  • 3.2.2 网页服务的需求45
  • 3.2.3 数据服务的需求45
  • 3.2.4 计算集群服务的需求45-46
  • 3.2.5 邮件服务的需求46
  • 3.3 系统的功能实现46-57
  • 3.3.1 系统的设计架构46-48
  • 3.3.2 页面的实现48-53
  • 3.3.3 系统与服务器接口的实现53-54
  • 3.3.4 其他主要程序的实现54-57
  • 第4章 系统的应用和性能分析57-65
  • 4.1 预测大肠杆菌三羧酸循环的调控模体57-60
  • 4.2 网站的使用性能60-65
  • 第5章 结论和展望65-67
  • 5.1 结论65-66
  • 5.2 展望66-67
  • 参考文献67-71
  • 作者简介及在学期间所取得的科研成果71-72
  • 致谢72

【参考文献】

中国期刊全文数据库 前1条

1 冉令华,阮晓钢;大肠杆菌启动子特征元件对启动子识别的影响[J];北京工业大学学报;2005年02期

中国博士学位论文全文数据库 前1条

1 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年


  本文关键词:基因转录调控模体预测的研究及其在线服务开发,由笔耕文化传播整理发布。



本文编号:285112

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/285112.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1dc6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com