当前位置:主页 > 科技论文 > 计算机论文 >

多区结构网格CFD典型求解器的CPU/GPU并行计算研究

发布时间:2021-11-03 23:25
  CPU/GPU异构并行计算是当前高性能计算研究的重要趋势,本文基于我国自主发展的WCNS高阶精度格式多区结构网格外流场空气动力学数值模拟实际应用背景,在国家超算长沙中心的“天河-1A”超级计算机系统上开展了典型CFD求解器的GPU并行计算和CPU/GPU协同并行计算的研究与实现。主要工作包括:1)对典型的显式、隐式CFD求解方法的基本原理、算法流程、计算的数据依赖关系等进行了深入分析;归纳出数据独立、弱数据依赖、强数据依赖和分支密集型等几种类型的CFD计算过程,相应地提出了基于网格点并行和基于网格线并行的GPU并行计算方法。结合CFD计算特点以及GPU体系结构和编程模型特点,实现、优化了显式龙格-库塔求解器和隐式雅可比迭代求解器的GPU并行计算,并用不同规模结构网格的真实算例对其性能进行了测试。结果表明:龙格-库塔求解器和雅可比迭代求解器的GPU并行加速随网格规模的增大而增大;在200万规模的单区结构网格上,二者分别取得了4.62倍和8.85倍的加速比;雅可比迭代求解器具有较好的GPU并行计算适应性。2)面向当前多核CPU和众核GPU高性能异构计算节点,结合CFD多区计算特点,对多区结... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

多区结构网格CFD典型求解器的CPU/GPU并行计算研究


CPU与GPU的浮点性能对比

性能对比,显存


CPU 和 GPU 的访存性能对比

计算收敛性,求解器,迭代计算,点松弛


于雅可比迭代是新引入的求解方法,故而本文先将雅可比迭代求解务程序中现有的点松弛求解器分别在 5 万、200 万和 7200 万的网格进行迭代计算收敛性的对比验证。从图 3.3 的测试结果可以看出,二算例中的迭代计算收敛性保持一致,雅可比迭代求解器能够很好地务程序的实际应用需求。

【参考文献】:
期刊论文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 杨学军,廖湘科,卢凯,胡庆丰,宋君强,苏金树.  Journal of Computer Science & Technology. 2011(03)
[2]基于GPU和隐式格式的CFD并行计算方法[J]. 张兵,韩景龙.  航空学报. 2010(02)
[3]Beginning a new period celebrating the 60th anniversary of the journal Scientia Sinica-(Science China)[J]. Da-Cheng Wang Editor-in-Chief.  Science China(Life Sciences). 2010(01)
[4]Jacobi和Laplace算法在GPU平台上的设计与实现[J]. 唐滔,林一松.  计算机工程与科学. 2009(S1)
[5]高阶加权紧致非线性格式(WCNS)在二维流动计算中的加速收敛研究[J]. 张毅锋,邓小刚,毛枚良,陈坚强.  空气动力学学报. 2008(03)
[6]一种可压缩流动的高阶加权紧致非线性格式(WCNS)的加速收敛方法[J]. 张毅锋,邓小刚,毛枚良,陈坚强.  计算物理. 2007(06)
[7]高阶精度耗散加权紧致非线性格式[J]. 邓小刚.  中国科学(A辑). 2001(12)



本文编号:3474540

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3474540.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2ac60***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com