适用于非定常流模拟的分布式并行GMRES方法
发布时间:2021-06-12 01:32
为提高计算流体力学方法的收敛性和对高性能并行计算机的适应性,发展了适用于非定常流模拟的GMRES并行全隐式方法,并开展了相应的收敛和并行特性研究。采用变子空间数GMRES方法,减小重启过程计算时间;通过分区并行和Hybrid LU-SGS预处理算子实现方法的分布式并行化;采用鲁棒的Negative-SA湍流模型获得更大CFL数,采取计算和存储雅可比矩阵、网格重排序方法提高计算效率。利用这套方法完成了平面流、NACA0012翼型扰流、翼身组合体扰流、F-16战斗机非定常气动弹性和旋翼前飞流场的数值模拟。结果表明其计算效率较LU-SGS方法提高20%~200%;适用于当代高性能计算机分布式并行结构,并行效率非常高,在240个计算核心上出现了加速比的超线性。
【文章来源】:空气动力学学报. 2019,37(05)北大核心CSCD
【文章页数】:10 页
【部分图文】:
图1分布式并行计算架构Fig.1Frameworkofdistributedparallel
面无黏流计算网格为三角形网格,如图2,共1426个网格点。图3给出了残差收敛到机器精度时显式方法(RK)、LU-SGS方法、无矩阵GMRES方法和矩阵GMRES方法(MGMRES)的对比。算例中最大子空间数m=10,GMRES重启次数为2,GMRES内残差收敛判据ε<0.1,本文后续算例均采用此设置。三种隐式方法均在1000步内收敛到机器精度,收敛性大大优于显示方法,收敛性最好的是MGMRES方法。图2平面流计算网格Fig.2Computationalgridforplaneflow图3平面流残差收敛曲线Fig.3ConvergencehistoryforplaneflowNACA0012翼型黏性扰流计算网格采用四边形单元,共23万网格点,如图4。计算条件为:来流马赫数Ma∞=0.15,迎角α=10°,雷诺数为Re=6×106。该算例中数值方法的收敛性受到密网格和高雷数严苛的考验。LU-SGS方法CFL数取1×106,GMRES和MGMRES方法均没有启动问题,CFL数可直接取300。图5分别给出迭代收敛曲线和CPU时间收敛曲线。可见残差收敛6个量级,LU-SGS方法需要约80000步,GMRES方法约10000步,MGMRES方法仅需2500步。计算时间上由于MGMRES每迭代步的计算时间较长,迭代初期其计算效率接近或低于GMRES方法。迭代后期MGMRES的收敛速度优势明显,仅需G
的效率。CFD计算中网格节点序号的重排序还可以减小计算过程中缓存未命中几率,提高计算效率。本文采用RCM(Reverse-Cuthill-McKee)方法进行网格节点序号的重排序。数值试验表明经过RCM排序后可提高约10%的计算效率。3收敛特性验证3.1二维定常流动本节将对比不同时间离散方法在二维平面无黏流和NACA0012翼型黏性绕扰流算例中的收敛性。二维平面无黏流计算网格为三角形网格,如图2,共1426个网格点。图3给出了残差收敛到机器精度时显式方法(RK)、LU-SGS方法、无矩阵GMRES方法和矩阵GMRES方法(MGMRES)的对比。算例中最大子空间数m=10,GMRES重启次数为2,GMRES内残差收敛判据ε<0.1,本文后续算例均采用此设置。三种隐式方法均在1000步内收敛到机器精度,收敛性大大优于显示方法,收敛性最好的是MGMRES方法。图2平面流计算网格Fig.2Computationalgridforplaneflow图3平面流残差收敛曲线Fig.3ConvergencehistoryforplaneflowNACA0012翼型黏性扰流计算网格采用四边形单元,共23万网格点,如图4。计算条件为:来流马赫数Ma∞=0.15,迎角α=10°,雷诺数为Re=6×106。该算例中数值方法的收敛性受到密网格和高雷数严苛的考验。LU-SGS方法CFL数取1×106,GMRES和MGMRES方法均没有启动
【参考文献】:
期刊论文
[1]基于雅可比矩阵精确计算的GMRES隐式方法在间断Galerkin有限元中的应用[J]. 龚小权,贾洪印,陈江涛,赵辉,周桂宇. 空气动力学学报. 2019(01)
[2]E级计算给CFD带来的机遇与挑战[J]. 张来平,邓小刚,何磊,李明,赫新. 空气动力学学报. 2016(04)
[3]一种适用于三维混合网格的GMRES加速收敛新方法[J]. 张健,邓有奇,李彬,张耀冰. 航空学报. 2016(11)
[4]基于高阶耗散紧致格式的GMRES方法收敛特性研究[J]. 燕振国,刘化勇,毛枚良,邓小刚,朱华君. 航空学报. 2014(05)
[5]适用于混合网格的并行GMRES+LU-SGS方法[J]. 康忠良,阎超. 空气动力学学报. 2013(02)
[6]三维动态非结构重叠网格Navier-Stokes方程并行算法[J]. 夏健,田书玲,王江峰,伍贻兆. 航空学报. 2008(05)
[7]CFD并行应用程序的可扩展性分析[J]. 陈军,王正华,李晓梅. 空气动力学学报. 2002(S1)
本文编号:3225679
【文章来源】:空气动力学学报. 2019,37(05)北大核心CSCD
【文章页数】:10 页
【部分图文】:
图1分布式并行计算架构Fig.1Frameworkofdistributedparallel
面无黏流计算网格为三角形网格,如图2,共1426个网格点。图3给出了残差收敛到机器精度时显式方法(RK)、LU-SGS方法、无矩阵GMRES方法和矩阵GMRES方法(MGMRES)的对比。算例中最大子空间数m=10,GMRES重启次数为2,GMRES内残差收敛判据ε<0.1,本文后续算例均采用此设置。三种隐式方法均在1000步内收敛到机器精度,收敛性大大优于显示方法,收敛性最好的是MGMRES方法。图2平面流计算网格Fig.2Computationalgridforplaneflow图3平面流残差收敛曲线Fig.3ConvergencehistoryforplaneflowNACA0012翼型黏性扰流计算网格采用四边形单元,共23万网格点,如图4。计算条件为:来流马赫数Ma∞=0.15,迎角α=10°,雷诺数为Re=6×106。该算例中数值方法的收敛性受到密网格和高雷数严苛的考验。LU-SGS方法CFL数取1×106,GMRES和MGMRES方法均没有启动问题,CFL数可直接取300。图5分别给出迭代收敛曲线和CPU时间收敛曲线。可见残差收敛6个量级,LU-SGS方法需要约80000步,GMRES方法约10000步,MGMRES方法仅需2500步。计算时间上由于MGMRES每迭代步的计算时间较长,迭代初期其计算效率接近或低于GMRES方法。迭代后期MGMRES的收敛速度优势明显,仅需G
的效率。CFD计算中网格节点序号的重排序还可以减小计算过程中缓存未命中几率,提高计算效率。本文采用RCM(Reverse-Cuthill-McKee)方法进行网格节点序号的重排序。数值试验表明经过RCM排序后可提高约10%的计算效率。3收敛特性验证3.1二维定常流动本节将对比不同时间离散方法在二维平面无黏流和NACA0012翼型黏性绕扰流算例中的收敛性。二维平面无黏流计算网格为三角形网格,如图2,共1426个网格点。图3给出了残差收敛到机器精度时显式方法(RK)、LU-SGS方法、无矩阵GMRES方法和矩阵GMRES方法(MGMRES)的对比。算例中最大子空间数m=10,GMRES重启次数为2,GMRES内残差收敛判据ε<0.1,本文后续算例均采用此设置。三种隐式方法均在1000步内收敛到机器精度,收敛性大大优于显示方法,收敛性最好的是MGMRES方法。图2平面流计算网格Fig.2Computationalgridforplaneflow图3平面流残差收敛曲线Fig.3ConvergencehistoryforplaneflowNACA0012翼型黏性扰流计算网格采用四边形单元,共23万网格点,如图4。计算条件为:来流马赫数Ma∞=0.15,迎角α=10°,雷诺数为Re=6×106。该算例中数值方法的收敛性受到密网格和高雷数严苛的考验。LU-SGS方法CFL数取1×106,GMRES和MGMRES方法均没有启动
【参考文献】:
期刊论文
[1]基于雅可比矩阵精确计算的GMRES隐式方法在间断Galerkin有限元中的应用[J]. 龚小权,贾洪印,陈江涛,赵辉,周桂宇. 空气动力学学报. 2019(01)
[2]E级计算给CFD带来的机遇与挑战[J]. 张来平,邓小刚,何磊,李明,赫新. 空气动力学学报. 2016(04)
[3]一种适用于三维混合网格的GMRES加速收敛新方法[J]. 张健,邓有奇,李彬,张耀冰. 航空学报. 2016(11)
[4]基于高阶耗散紧致格式的GMRES方法收敛特性研究[J]. 燕振国,刘化勇,毛枚良,邓小刚,朱华君. 航空学报. 2014(05)
[5]适用于混合网格的并行GMRES+LU-SGS方法[J]. 康忠良,阎超. 空气动力学学报. 2013(02)
[6]三维动态非结构重叠网格Navier-Stokes方程并行算法[J]. 夏健,田书玲,王江峰,伍贻兆. 航空学报. 2008(05)
[7]CFD并行应用程序的可扩展性分析[J]. 陈军,王正华,李晓梅. 空气动力学学报. 2002(S1)
本文编号:3225679
本文链接:https://www.wllwen.com/kejilunwen/lxlw/3225679.html