GRAPES全球模式MPI+OpenMP混合并行方法
发布时间:2024-01-30 21:33
近几年来随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为高性能计算机市场主流架构。高性能计算机的计算核数不断增加,同时计算性能保持一定的年增长速度增长。作为高性能计算的重要应用,气象数值模式预报准确率的提高很大程度上得益于分辨率的提高,使得模式能够模拟更加真实的物理动力过程。但模式分辨率的提高意味着计算量的成倍增长。为适应目前既有分布又有共享内存的硬件体系架构以及解决分辨率提高带来的计算量增长问题,可以使用MPI+OpenMP混合编程模型,实现集群节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式优点,MPI用于结点间通信,OpenMP用于结点内并行计算,提高模式的并行度。 本文采用MPI+OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行混合并行方案设计和优化。具体混合并行原则是对于计算量均匀分布,同时线程安全的格点计算使用tile并行,tile并行使用一维纬向tile划分。对于计算量不均匀的格点计算、程序内部线程不安全或存在MPI通信以及有负载平衡问题的物理过程,则选择循环并行方法。 本文分别使用分辨率为1°和0.25°的数...
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
本文编号:3890403
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图1.1SMP集群简单示意图
图1.1SMP集群简单示意图
图1.2TOP500性能增长曲线-2013年(引自http://www.top500.org/statistics/perfdevel/)
图1.1SMP集群简单示意图
图1.3TOP500计算机计算核数情况-2013年11月发布
图1.3TOP500计算机计算核数情况-2013年11月发布(引自http://www.top500.org/statistics/efficiency-power-cores/)高性能计算机发展限制除了CPU性能提升问题外,功耗也是一大问题。为了解问题,硬件厂....
图1.4TeslaC1060架构和流多处理器结构
图1.4TeslaC1060架构和流多处理器结构tel公司于2012年推出MIC架构产品。MIC使用和GPGPU一IC芯片上有几十个基于精简的x86指令集的核心,这意味着IC设备上运行(图1.5)。MIC的核心可以超线程,每个核心
本文编号:3890403
本文链接:https://www.wllwen.com/projectlw/qxxlw/3890403.html