当前位置:主页 > 科技论文 > 计算机论文 >

并行计算在生物信息学中的运用和实现

发布时间:2022-01-27 14:12
  生物信息学是多门学科相互交叉而形成的一门新兴学科,是当今生命科学和自然科学的核心领域和最具活力的前沿领域之一。使用计算机系统进行科学计算和模拟已经成为现代生物研究最重要的方法之一。在生物信息学中,DNA序列的比对、拼接和基因表达数据的聚类分析是最常见也是重要的内容,它们数据量多、计算量大,对计算机的处理速度等性能要求较高。虽然高性能并行计算机能够满足大规模计算的需要,但其价格昂贵,使用成本高。本文提出使用PC机构建局域网络,开发并使用并行化的生物信息学软件。本文提出了一种可扩展的架构模式BioMpi。在深入分析现有的phrap软件的前提下,针对并行计算环境,提出一种新的并行算法并实现了基于BioMpi架构下的并行拼接软件mpiphrap。本文还针对mpiblast和HMMER这2款并行化的软件,给出了并行化接口并移植于BioMpi架构下。最后,分别针对基于BioMpi架构下mpiphrap、mpiblast和HMMER这3款软件进行了测试,并给出了在单节点和多节点运行环境的情况下的测试结果。试验数据... 

【文章来源】:南京林业大学江苏省

【文章页数】:50 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
ABSTRACT
第一章 绪论
    1.1 课题背景
    1.2 国内外生物并行软件的研究现状
        1.2.1 并行计算的研究进展
        1.2.2 phrap 研究进展
        1.2.3 BLAST 研究进展
        1.2.4 HMMER 的研究进展
    1.3 本课题的研究意义和主要内容
        1.3.1 本课题的研究意义
        1.3.2 本课题的主要研究工作
第二章 并行软件架构体系Bio_Mpi 的开发
    2.1 开发语言介绍
        2.1.1 MPI 简介
        2.1.2 通信域
        2.1.3 MPI 调用接口
        2.1.4 MPI 并行编程模式
        2.1.5 MPI 通信模式
    2.2 模型设计
    2.3 Bio_Mpi 架构图
    2.4 Bio_Mpi 的开发
        2.4.1 主节点的初始化串行处理过程
        2.4.2 各节点的并行处理过程
        2.4.3 主节点汇总处理过程
    2.5 mpiphrap 的开发
        2.5.1 mpiphrap 的并行思想
        2.5.2 mpiphrap 的并行算法
第三章 并行软件架构体系Bio_Mpi 的测试
    3.1 Bio_Mpi 的测试环境
    3.2 mpiphrap 的测试
        3.2.1 杨树的mpiphrap 测试
        3.2.2 芝麻的mpiphrap 测试
    3.3 mpiblast 的测试
        3.3.1 测试使用的软件版本
        3.3.2 Swiss_Prot 数据库的测试
        3.3.3 env_nr 数据库的测试
    3.4 HMMER 的测试
        3.4.1 hmmbuild 的测试
        3.4.2 hmmsearch 的测试
第四章 结束语
参考文献
附录A Fedora 操作系统中的设置
    1 Fedora 的准备工作
    2 创建NFS 服务
        2.1 服务器的设置
        2.2 客户机的设置
    3 创建SSH 信任连接
    4 安装MPICH2
    5 环境测试
    6 编写程序并运行
    7 卸载环境
附录B 安装mpiblast
    1 下载和解压
    2 安装ncbi
    3 安装mpiblast
    4 mpiblast 环境设置
附录C 安装HMMER3
    1 安装hmmer
详细摘要


【参考文献】:
期刊论文
[1]基于HMM的基因识别并行计算[J]. 王栋,李靖,武华北,宋婷.  计算机与信息技术. 2007(10)
[2]基于HMM的基因识别并行计算[J]. 王栋,李靖,武华北,宋婷.  计算机与信息技术. 2007 (10)
[3]基于曙光4000A的BLAST并行算法[J]. 谭光明,徐琳,周幼英,冯圣中,孙凝晖.  计算机工程. 2006(10)
[4]基于SSE2的Smith-Waterman算法[J]. 戴正华,张庆丹,徐琳,谭光明,冯圣中.  计算机工程与应用. 2006(11)
[5]一种SMP机群下程序并行化模式的设计与应用[J]. 刘玮.  微电子学与计算机. 2005(11)
[6]基于隐马尔可夫模型的多重序列分析[J]. 罗泽举,朱思铭,何淼.  中山大学学报(自然科学版). 2005(02)
[7]Linux环境下MPI并行编程与算法实现研究[J]. 曾志峰.  航空计算技术. 2004(02)
[8]基因序列分析软件Hmmpfam的可扩展并行性能优化[J]. 陈军,赵文辉,莫则尧,李晓梅.  软件学报. 2004(02)
[9]序列拼装程序的并行化研究与实现[J]. 蔡立志,童维勤,廖文昭.  计算机工程与应用. 2003(14)
[10]隐马尔可夫模型用于蛋白质序列分析[J]. 吴晓明,宋长新,王波,程敬之.  生物医学工程学杂志. 2002(03)



本文编号:3612627

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3612627.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7cec1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com