面向数据通信优化的并行程序执行模型
发布时间:2020-03-23 21:14
【摘要】:并行计算模型是并行计算的重要研究内容。随着高性能计算技术的日益发展,并行计算的软硬件结构也越来越复杂.一方面计算机硬件持续复杂化,如多核处理器、异构多平台、各种高速网络等技术的加入,使得应用程序在这些平台上的执行行为难以预测;另一方面计算机软件持续抽象化,并日益脱离硬件。传统的并行计算模型已不能适应当前并行计算的高速发展。分层并行计算模型的提出,从算法设计,程序实现和程序执行三个层次分别考虑,力图解决并行计算模型不能适应当前并行计算发展的矛盾。 并行程序执行模型是分层并行计算模型的重要组成部分,其中的数据通信过程又是并行程序执行模型中重要的一个方面,因为其与并行系统中的若干子系统相关,如系统连接拓扑结构,应用程序通信拓扑,互连网络性能,处理器间同步、负载平衡等等。本文基于若干实际应用研究,力图构建面向数据通信优化的并行程序执行模型,将并行程序中的数据通信过程划分为三个子过程:数据准备过程,通信准备过程以及数据传输过程。这三个子过程之间存在紧密的联系却又有一定独立性,并且均对程序通信的速度和效率有着重要影响。本文从三个不同的并行计算实例中深入分析这三个部分的特点以及优化方法,从不同角度揭示了优化并行程序通信效率的若干方法。具体而言,本文的主要研究成果和创新点可概括为以下几点: (1)提出了面向数据通信优化的并行执行模型:通过对MPI实现中的通信操作过程进行深入研究,从中抽取出影响并行计算程序数据通信效率的各种因素,将整个数据通信过程分解为数据准备、通信准备以及数据传输三个子过程,分析了这三个子过程各自的特点和研究内容,本文提出了面向数据通信优化的并行程序执行模型。同时给出了模型的一些性质和讨论,以期能够预测出并行应用程序在运行时的行为以及帮助程序执行者对应用程序的数据通信过程进行优化。 (2)研究了数据准备过程中的优化方法,并在三维快速傅里叶变换的应用中讨论了其执行模型:数据准备过程的优化极大地影响着数据通信的效率。本文以三维快速傅里叶变换的实际应用为例,探讨了数据准备过程的优化对数据通信的重要影响。本文同时提出了一种新的三维快速傅里叶变换的并行算法,针对稀疏三维向量的傅里叶变换,通过重新调整X、y、z三个方向的计算顺序,能最大限度地减少结点间的通信量,从而减少计算时间,提高并行加速比。 (3)对通信准备过程中的优化方法进行了探讨,并研究了Sort-Last模式下图像合成过程实现程序的执行模型:通信准备过程在数据通信三个子过程中起着承上启下的作用,本文以Sort-Last模式下的并行绘制为例,研究了通信准备过程中的优化方法。图像合成是并行绘制中的一个性能瓶颈,本文提出了一系列基于流水线的并行图像合成方法,通过重叠图形绘制时间和通信时间得到了流畅的实时绘制效果。实验表明,流水线方法在结点数目的可扩展性上和图像像素可扩展性上均优于已有算法。 (4)研究了数据传输过程的优化方法,并使用了执行模型分析预测了动态进程映射方法在实现中的性能和执行行为:数据传输是三个子过程中最为复杂和难以预测的过程。本文在优化MPI程序中的群集操作的实现中,基于数据传输过程选择最优信道的思路,提出了动态进程映射方法。其基本思想是在运行时改变进程的编号来改变群集操作拓扑结构,以期优化应用程序运行时的通信效率。对于不同的运行时环境我们分别提出离线和在线两种不同的方法来计算映射数组。本文基于MPICH2实现了动态进程映射方法,并在实验中验证了执行模型的实用性和有效性。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP338.6
本文编号:2597276
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP338.6
【参考文献】
相关期刊论文 前4条
1 计永昶,丁卫群,陈国良,安虹;一种实用的并行计算模型[J];计算机学报;2001年04期
2 张云泉;面向高性能数值计算的并行计算模型DRAM(h)[J];计算机学报;2003年12期
3 张俊霞;张焕杰;李会民;;基于龙芯2F的国产万亿次高性能计算机KD-50-I的研制[J];中国科学技术大学学报;2008年01期
4 陈国良;苗乾坤;孙广中;徐云;郑启龙;;分层并行计算模型[J];中国科学技术大学学报;2008年07期
相关博士学位论文 前1条
1 苗乾坤;面向共享存储系统的计算模型及性能优化[D];中国科学技术大学;2010年
,本文编号:2597276
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2597276.html