一种改进的NHBL并行计算模型及其性能评测
发布时间:2020-07-24 10:03
【摘要】: 论文以并行计算模型为核心展开研究。并行计算模型为并行算法和并行计算机系统结构的分析与设计提供了具有指导意义的理论界面和模型框架,它是并行计算研究的重要领域。目前在并行计算中,尚未有一个如冯·诺伊曼模型般在顺序计算中取得成功的真正统一通用的并行计算模型,来保证硬件设计者设计多种计算机结构而无须考虑被执行的软件,软件设计者编写各种有效执行的程序而无须考虑所使用的硬件。因此论文以并行计算模型为课题展开研究。 论文首先对非独占、异构、同步的NHBL(Nondedicated Heterogeneous Barrier LogGP model)模型做了详细地介绍,NHBL是基于LogGP模型提出的,LogGP模型没有考虑到节点的异构和非独占性,不能很好的对并行计算的时间开销进行描述。NHBL模型在LogGP模型基础上,考虑了节点计算资源的异构性、节点计算资源的非独占性,但对节点间通信的损耗没有进行描述。本文基于这点,提出了考虑网络拥塞的非独占、异构、同步的LogGP模型,即NHBCL(Nondedicated Heterogeneous Barrier Congestion LogGP model)模型。NHBCL模型通过引入网络阻塞指数对节点间通信的损耗性进行了细致的描述。 论文描述了NHBL模型和NHBCL模型和它们各自的计算开销和通信开销,并对求π值的并行计算时间进行预测。然后在MPI环境下的实验集群上实现了计算π值的并行算法,最后用实验结果与预测结果进行了比较。实验结果表明,NHBCL模型很好地刻画了基于集群的并行计算的特征,对基于集群的并行计算是实用的和正确的,同时进一步证明NHBCL模型相比于NHBL模型更具有可用性。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP316.4;TP338.6
【图文】:
型和 BSP 模型并行)模型定义一个并行结构由以下三个部分组成[17]器/存储器模块对;器/存储器模块对之间点到点传递信息的选路器;所有处理器/存储器模块对的全局通信机制。况,BSP 计算模型设定了三个定量参数:数量;吞吐率,也称带宽因子;障同步之间的时间间隔。SP 模型的算法由若干个超步(Superstep)组成,在。
图 4-1 求π近似值方法的示意图象下面从 0 到 1 之间的面积即为 的值而该面积可以用来近似矩形的高度取函数在矩形中间点的取值当用更就越接近于真实的 值设将 0 到 1 的区间划分为 N 个1 12 - 1 1 1 ( ) ( 2N Ni ii if fN N N = =× × = ××∑ ∑::P0播送 N 到其他处理器中,令 i 为处理器号;:每个处理器分别计算 MyPI(i)。MyPI(i)=0h=1.0/Nfor(j=i;j<N;j+=P){
本文编号:2768681
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP316.4;TP338.6
【图文】:
型和 BSP 模型并行)模型定义一个并行结构由以下三个部分组成[17]器/存储器模块对;器/存储器模块对之间点到点传递信息的选路器;所有处理器/存储器模块对的全局通信机制。况,BSP 计算模型设定了三个定量参数:数量;吞吐率,也称带宽因子;障同步之间的时间间隔。SP 模型的算法由若干个超步(Superstep)组成,在。
图 4-1 求π近似值方法的示意图象下面从 0 到 1 之间的面积即为 的值而该面积可以用来近似矩形的高度取函数在矩形中间点的取值当用更就越接近于真实的 值设将 0 到 1 的区间划分为 N 个1 12 - 1 1 1 ( ) ( 2N Ni ii if fN N N = =× × = ××∑ ∑::P0播送 N 到其他处理器中,令 i 为处理器号;:每个处理器分别计算 MyPI(i)。MyPI(i)=0h=1.0/Nfor(j=i;j<N;j+=P){
【引证文献】
相关博士学位论文 前1条
1 苗乾坤;面向共享存储系统的计算模型及性能优化[D];中国科学技术大学;2010年
本文编号:2768681
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2768681.html