面向众核系统的块Gauss-Seidel/Jacobi预条件子空间迭代法
发布时间:2025-02-08 18:52
大规模科学与工程计算应用对计算需求的不断增长,推动着高性能计算机系统计算能力迈向E级。未来E级系统在提供巨大计算能力的同时,也将给传统数值并行算法带来巨大挑战和机遇。NKS(Newton-Krylov-Schwarz)算法作为求解大规模非线性方程组的求解器,在并行计算领域具有广泛应用。面向未来的E级系统,NKS算法将会产生全局通信瓶颈和无法充分利用异构众核架构并行性等问题,这对算法性能和可扩展性造成巨大影响。基于这一问题,研究了面向众核系统的块Gauss-Seidel/Jacobi预条件子空间迭代法,主要包括以下三个方面:1、针对Krylov子空间迭代法中存在的全局通信瓶颈,基于LogP模型建立了一套全新的算法性能模型,该模型定量分析得出了Krylov子空间迭代法在大规模节点的情况下产生的全局通信瓶颈。在此基础上,提出并实现了对PETSc高性能计算工具箱中GMRES、Chebyshev、Richardson、TCQMR四种Krylov子空间算法中包含的向量内积、范数和标准化步骤进行非阻塞式通信优化策略。在天河二号超级计算机平台上对MPIAllreduce和MPI
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
本文编号:4031822
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图2.14个处理器上运行GMRES的通信过程示意图
图2.14个处理器上运行GMRES的通信过程示意图2.2Krylov子空间迭代法的性能建模2.2.1基于LogP模型的性能建模针对KSMs算法中的三个核心模块(即SpMV,向量内积和向量更新操作),考虑建立一套基于LogP模型的性能模型,以达到定量分....
图2.2阻塞发送和阻塞接收过程示意图
国防科技大学研究生院专业学位硕士学位论文3.1非阻塞通信标准说明非阻塞通信之前,首先需要简单介绍MPI中的阻塞通信。阻塞发送和阻塞接收,如图2.2所示,在调用MPI中的阻塞通信并成功返需传递的消息已经成功发出或接收,且缓冲区的数据已经传递完毕返回后,缓冲区可被释放;....
图2.3非阻塞发送和非阻塞接收过程示意图
图2.4THExpress-2互联网络架构与拓扑
图2.4THExpress-2互联网络架构与拓扑2性能结果MPI标准中的MPI<sub>A</sub>llreduce和MPI<sub>I</sub>allreduce接口,在天河二上测试得到的数据如图2.5。其中,采用的MPI实现为MPICH传输的....
本文编号:4031822
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4031822.html