当前位置:主页 > 理工论文 > 气象学论文 >

通信避免的广义共轭余差算法

发布时间:2022-01-06 07:32
  随着现代气象事业的发展,对数值天气预报模式的分辨率提出了越来越高的要求。数值天气预报模式的运行速度是提高模式分辨率的客观前提,是必要非充分条件。大规模并行计算是目前提高模式运行速度的主要手段。超级计算集群的规模不断扩大,性能不断提升。为充分利用大规模超级计算集群的计算能力,数值模式的可扩展性需要提高。中国气象局的“全球/区域一体化数值预报系统(GRAPES)”由动力框架、可自由组合的物理过程参数化方案、全球区域一体化资料同化系统等部分组成。其动力框架部分的核心,是一个亥姆霍兹方程求解器。方程的系数矩阵是一个大型稀疏矩阵,矩阵每行有19个非零元。该方程求解器所采用的迭代算法是“广义共轭余差算法(GCR)”。制约方程求解器模块可扩展性的主要原因,是GCR算法中因为长向量点乘而带来的密集的全局通信。本文提出了“通信避免的广义共轭余差算法(CA-GCR)”,以短向量的迭代替代原算法中的长向量迭代,避免了迭代过程中的全局通信,使全局通信在迭代开始前的计算部分一次性的集中进行。新算法的全局通信次数较之原算法降低了一个数量级(通信总量没有减少),同时减少了部分本地计算量。缺点是小幅降低了收敛速度,即... 

【文章来源】:中国气象科学研究院北京市

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

通信避免的广义共轭余差算法


Mira超级计算集群上MPI通信用时对比(图片引自SC2018,Sudheer文章)

超级计算,图片


12图 1.2 Cetus 超级计算集群上 MPI 通信用时对比(图片引自 SC2018,Sudheer 文章)由图可见,本文主要讨论的 MPI_Allreduce 通信,在其他计算集群上也普遍存在较多的情况。除了这种情况外,其他形式的通信在各种数值模式中也非常常见。例如以差分替分的过程中,需要选取相邻点的值进行差分计算,而处在边界的点的相邻点有可能程内,也可能在进程外(翟琰,2011)。如果需要的相邻点在进程外,就需要在相邻间进行通信,即边界通信。常见的做法是在计算区域之外再加一层 halo 区,该区域度取决于要解决的问题需要而定。通过通信先把相应的数据从临近进程获得到halo区样在进行相应计算的时候,就可以直接取 halo 的数据进行使用。但是这个区域的数

算法收敛,速率,算法


图 3.1 新旧算法收敛速率说明:GRAPES中的GCR算法用残差r0的全体元素的平方和来衡量方程是否收敛。空间格点总数不变,只取决于选取的算例的分辨率,因此不需要进行平均、开方等,收敛阈值定为 1.0x10-9,图中纵坐标是残差的常用对数。由图 3 可知,本次求解中,随着迭代次数的增加,CA 算法的收敛速率略慢于原算法,这在一般 CA 算法普遍存在的。更主要的是,CA 算法的迭代次数为不连续的、10 的整数倍(因为 s=10)法达到收敛阈值的迭代次数是 33 次,CA 算法达到收敛阈值的次数是 40 次。在整个测试中,CA 算法的平均迭代次数高于原算法的原因主要有以下三条:(1)CA 算法的迭代次数只能是 s 的整数倍,即使两种算法收敛速率相同,也必然 CA 算法要比原算法多算一段“剩余部分”。(2)所有 CA 算法由于基(basis)的条件数的限制,都存在最高收敛精度降低、收率小幅变慢的问题。Erin Carson 于 2012 年针对各种 CA 算法中出现的这类问题给出余差替代”解决方案(Erin C,2012),本文所提出的算法也存在相同的问题,但由余差替代”方案开销较大,因此没有采纳。(3)前文中修改第 12 步,改变生成新的 z0、p0的方法,使得算法完全重启,z0、

【参考文献】:
期刊论文
[1]基于MPI+OpenMP混合编程模式的大规模颗粒两相流LBM并行模拟[J]. 何强,李永健,黄伟峰,李德才,胡洋,王玉明.  清华大学学报(自然科学版). 2019(10)
[2]并行计算的一体化研究现状与发展趋势[J]. 甘云志.  电子技术与软件工程. 2019(07)
[3]我国高性能计算科技政策分析——与美国NSCI计划对比[J]. 历军.  中国科学院院刊. 2019(02)
[4]并行计算的发展及前景[J]. 邵帅.  科技经济导刊. 2019(02)
[5]高性能计算的发展现状分析[J]. 张晓峰,李昭,陈鹏.  信息通信. 2019(01)
[6]分布式独立内存简易高性能计算集群搭建测试与应用[J]. 韩菲,李炜.  网络安全技术与应用. 2018(12)
[7]基于超算的全球电离层模型快速并行解算[J]. 施闯,王成,张涛.  武汉大学学报(信息科学版). 2018(12)
[8]基于GPU的大规模多阶段任务系统可靠性并行计算方法[J]. 闫华,汪贻生,王锐淇,刘波,郭立卿,肖骅.  系统工程与电子技术. 2019(01)
[9]基于GPU通用计算的深度学习模型性能分析[J]. 齐万华,胡向阳.  科技视界. 2018(32)
[10]高性能计算及其在航空发动机中的应用[J]. 刘婷,付强.  航空动力. 2018(04)



本文编号:3572028

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/qxxlw/3572028.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3183f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com