当前位置:主页 > 科技论文 > 计算机论文 >

高可用MPI并行编程环境及并行程序开发方法的研究与实现

发布时间:2020-12-25 04:46
  科学技术的发展进步使得越来越多的学科领域开始采用科学计算、数值模拟的手段来解决科学研究和工程实践中遇到的各种问题,这些应用问题往往具有大计算量,大数据存储量,以及大数据交换量的需求,大规模并行计算机系统是当前满足这些高性能计算需求的主流计算机系统结构实现方式。随着并行计算机系统规模的扩展,随之而来的是并行应用的可扩展性难题和系统可靠性的降低,一些超大规模并行计算系统的平均故障间隔时间甚至只有几小时,在这种情况下,如果不能提供高性能、具有容错能力的并行软件开发和运行环境,那么很多大规模的并行应用将无法高效率地运行,并最终成功完成,这将严重影响系统和应用的可用性。消息传递是开发并行应用的主要编程模型,MPI是消息传递编程接口的事实标准,具有并行算法实现灵活、性能高和可移植性好等特点。本论文紧密围绕提高大规模并行计算机系统和应用的可用性这一中心目标,对实现高可用MPI并行编程环境的相关问题展开研究,包括性能、可扩展性和容错能力。另外,考虑到未来并行计算系统的规模还将进一步扩大,为了更有效的进行容错处理,论文还从MPI并行程序开发的角度,研究探讨了高效的容错并行算法设计方法。论文的主要研究成果... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:127 页

【学位级别】:博士

【部分图文】:

高可用MPI并行编程环境及并行程序开发方法的研究与实现


CMEx总体结构

反例,路径,保守性,性质


(eounter一 ExampleGuidedAbstraetionRefinement)方法的迭代模型检验框架,以便尽量降低验证的时空复杂度。CEGAR方法最早在文献【 115]中提出,其基本思想如图2.巧所示。对程序P,我们先以很小的代价给出一个粗略的初始抽象模型M,,并保证抽象过程的保守性,即保证M;中包含程序P的所有可行执行路径。如果模型MI满足给定的性质,则抽象的保守性保证了程序P也满足给定的性质。如果Ml不满足给定的性质,则我们检查给出的反例路径是否在程序P中真实存在,女「果不存在,则该反例路径是由于模型M:的抽象粒度太粗而引入的伪反例路径,我们根据该反例路径对M,进行精化

结构设计图,写数据,传输通道,结构设计


国防科学技术大学研究生院博士学位论文问题2,由于RDMA写是一种单边通信操作,因此接收方通常采用数据区中特定标记的检测来判断数据是否到达。CMEX通信软件接口种事件机制,可以在RDMA写操作后触发远程事件,接收方检测到事断盼MA写数据的到达。在ohi。stateuniversity大学的MvAPIeH[,提出了一种基于hifiniBand的RDMA写通信机制的数据传输方法,可次RDMA写通信操作来完成数据,但这种方法要求RDMA写操作的序传输。在我们的CNI接口实现平台上,基于PCI一X总线的接口卡A写操作数据传输的顺序性,但在NC中,RDMA写操作的数据就有的。因此我们参考了MVAPICH提出的技术途径,并做了部分修改,HZ一CMEX的RDMA写数据传输通道。RDMA写数据传输通道的结构设计如图3.3所示。

【参考文献】:
期刊论文
[1]一个适合大规模集群并行计算的检查点系统[J]. 周恩强,卢宇彤,沈志宇.  计算机研究与发展. 2005(06)

博士论文
[1]基于SMP结点的机群通信系统关键技术的研究[D]. 马捷.中国科学院研究生院(计算技术研究所) 2001



本文编号:2936985

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2936985.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9c424***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com