当前位置:主页 > 科技论文 > 数学论文 >

基于非结构网格的可压缩粘性流动数值方法的GPU实现

发布时间:2017-04-15 01:06

  本文关键词:基于非结构网格的可压缩粘性流动数值方法的GPU实现,由笔耕文化传播整理发布。


【摘要】:近年来,CPU的性能提升受制于功耗和工艺逐渐放缓了脚步,而图形处理器(GPU)由于其出色的浮点运算性能以及相较于CPU更高的内存带宽在科学计算领域中得到了越来越多的青睐。学者们尝试将GPU应用于CFD领域,并且获得了不错的加速效果。本文实现了GPU平台的、基于非结构网格、采用有限体积方法的RANS方程求解器,其适用于三维可压缩、定常/非定常流动的数值仿真。采用格点格式进行控制体的离散。实现了Roe和Hllc通量计算格式,通过线性重构结合Venkatakrishnan限制器实现了空间上的二阶精度。时间离散方面讨论了显式Runge-Kutta方法以及隐式LU-SGS方法在GPU上的可行性。本文也将Runge-Kutta方法应用于非定常计算中的时间积分,但是为了加速时间推进,进一步地讨论了时间离散上具备二阶精度的双时间步长方法。采用Spalart-Allmaras一方程湍流模型封闭RANS方程,加入DES选项在分离区引入大涡模拟特性而边界层内仍然采用RANS方程。此外,针对规模较大的网格,实现了基于KD-Tree方法的物面距求解。针对如上算法,通过详细分析GPU软、硬件架构,提出了一套完整的、高效的、采用双精度浮点数的内核函数设计及执行方案。针对非结构网格及格点格式特性,进行了基于硬件利用率、内存访问以及指令执行三个层次的深度优化,并提出了全新的、适用于本套算法的网格排序方法。通过多个定常/非定常算例验证了本文实现的正确性,实现了Runge-Kutta方法在单GPU上相较于CPU串行程序82~116倍的加速效果以及LU-SGS方法在单GPU上55~100倍的加速效果。结果充分展示了GPU在CFD领域中良好的应用前景。
【关键词】:计算流体力学 非结构网格 格点格式 GPU CUDA 双精度 并行计算 非定常 网格排序
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O241.82;O35
【目录】:
  • 摘要4-5
  • ABSTRACT5-11
  • 注释表11-12
  • 第一章 绪论12-16
  • 1.1 研究背景12-13
  • 1.2 研究现状13-15
  • 1.3 本文主要工作15-16
  • 第二章 数值方法16-37
  • 2.1 引言16
  • 2.2 控制方程16-18
  • 2.3 空间离散18-23
  • 2.3.1 基于非结构网格的有限体积方法18-19
  • 2.3.2 对流通量离散19-23
  • 2.3.3 粘性通量离散23
  • 2.4 时间离散23-29
  • 2.4.1 Runge-Kutta方法23-26
  • 2.4.2 LU-SGS方法26-28
  • 2.4.3 双时间步长方法28-29
  • 2.5 湍流模型29-33
  • 2.5.1 Spalart-Allmaras一方程模型29-31
  • 2.5.2 基于KD-Tree的物面距计算方法31-33
  • 2.6 边界条件33-34
  • 2.7 数值方法验证34-36
  • 2.7.1 RAE2822跨音速翼型算例34-35
  • 2.7.2 KD-Tree与直接计算方法对比35-36
  • 2.8 本章小结36-37
  • 第三章 GPU并行加速37-65
  • 3.1 GPU基本介绍37-48
  • 3.1.1 GPU硬件模型38-41
  • 3.1.2 GPU执行模型41-44
  • 3.1.3 GPU存储器模型44-46
  • 3.1.4 GPU软件模型46-48
  • 3.2 求解器设计48-57
  • 3.2.1 流程分析及相关定义48-52
  • 3.2.2 格点格式的实现难点52-53
  • 3.2.3 GPU求解器实现方案53-57
  • 3.2.4 边界条件及规约57
  • 3.3 性能优化57-64
  • 3.3.1 硬件利用率57-58
  • 3.3.2 内存58-63
  • 3.3.3 指令63-64
  • 3.4 本章小结64-65
  • 第四章 算例分析及性能评估65-82
  • 4.1 ONERA M6机翼算例65-67
  • 4.2 DLR-F6翼身组合体算例67-72
  • 4.3 二维圆柱卡门涡街算例72-73
  • 4.4 高雷诺数圆柱DES数值模拟73-76
  • 4.5 性能评估76-81
  • 4.5.1 Kernel设计方案对比77
  • 4.5.2 不同优化方法效果分析77-79
  • 4.5.3 不同网格总加速性能分析79-80
  • 4.5.4 Runge-Kutta和LU-SGS对比80
  • 4.5.5 GPU与CPU实现的能量性价比80-81
  • 4.6 本章小结81-82
  • 第五章 总结与展望82-84
  • 5.1 总结82
  • 5.2 本文创新点82-83
  • 5.3 展望83-84
  • 参考文献84-89
  • 致谢89-90
  • 在学期间的研究成果及发表的学术论文90

【参考文献】

中国期刊全文数据库 前3条

1 鞠鹏飞;宁方飞;;GPU平台上的叶轮机械CFD加速计算[J];航空动力学报;2014年05期

2 刘枫;李桦;田正雨;潘沙;;基于MPI+CUDA的异构并行可压缩流求解器[J];国防科技大学学报;2014年01期

3 董廷星;李新亮;李森;迟学斌;;GPU上计算流体力学的加速[J];计算机系统应用;2011年01期


  本文关键词:基于非结构网格的可压缩粘性流动数值方法的GPU实现,,由笔耕文化传播整理发布。



本文编号:307239

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/307239.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f0e94***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com