当前位置:主页 > 科技论文 > 计算机论文 >

面向求解三维复杂流动问题的GPU并行算法及其应用研究

发布时间:2020-07-17 19:40
【摘要】:近年来,一种新的基于GPU(Graphics Processing Unit)的并行计算技术,随着图形快速渲染需求应运而生,备受工程界和学术界的关注。基于GPU异型架构发展新型的并行算法,已成为当前计算流体力学(CFD)领域研究的热点之一。本文紧扣这一并行算法发展的趋势,结合工程应用中经常遇到的Euler方程和Navier-Stokes方程三维复杂流动求解问题,开展了适合处理复杂几何外形的有限体积法和无网格算法的GPU并行化研究。先对显式格式网格方法的GPU并行化改造问题进行了研究。针对格点格式有限体积法,围绕并行计算任务划分、GPU线程结构和核函数(Kernel)构建以及数据存储结构构造等问题,开展了GPU并行化改造工作。具体根据有限体积法计算流程,提出了GPU并行任务划分的一般方法;再根据计算发生的位置对并行任务进行分类,并依此构建出与各自计算规模相适应的GPU线程结构和核函数。进一步为了提高核函数的数据访问效率,提出了适合GPU的格点格式有限体积法数据存储结构,该结构能较好地满足GPU内存合并访问要求。最后,用翼型和机翼典型绕流算例对发展的显式格式有限体积GPU并行算法进行了并行加速效率考核,取得了预期的效果。接着研究了隐式格式网格方法的GPU并行化改造问题。隐式格式固有的强数据依赖性不适合GPU线程运算数据独立性(Data Independency)的要求。本文针对这一瓶颈问题,提出了网格顶点着色分组方法。通过着色处理将网格顶点分为一系列颜色分组,使得每一分组内不同网格顶点的隐式计算相互独立。利用所提网格顶点着色分组方法,成功地对LU-SGS格式进行了GPU并行化改造,发展出适合GPU并行计算的LU-SGS隐式格式,并结合Euler方程和Navier-Stokes方程的求解,用典型绕流算例对发展的隐式格式有限体积GPU并行算法进行了考核运算。结果表明,如预期,发展的隐式格式GPU并行算法计算效率能进一步提升,相比显式格式能进一步提高2至4倍左右。最后开展了无网格方法的GPU并行化研究,致力于发展出无网格GPU并行算法。无网格方法计算区域的离散只涉及布点,具有灵活性而特别适合复杂外形复杂绕流问题的处理,但因其点云结构等特殊性,算法的GPU并行化在国内外还不多见。本文结合无网格点云结构特点,构建并行线程与无网格点云中心点之间的点映射关系,提出了基于这一点映射的无网格GPU并行化改造的实施方法。具体先结合Runge-Kutta格式,发展了显式格式无网格GPU并行算法;再在显式算法取得成功的基础上,开展了隐式无网格GPU并行算法的研究。结合无网格点云结构特点,提出了基于点云拓扑关系的点着色分组技术,成功地发展出隐式格式无网格GPU并行算法。接着对发展的算法开展了并行加速效率进一步提升的研究。具体在上述基于点映射的无网格GPU算法框架下,研究了核函数合并方法,因降低了总内存访问量,提高了整体计算效率;同时,针对不规则点云上GPU算法的计算效率相对较低的问题,提出了无网格点分层着色排序(Multi-Layered Point Reordering,MLPRO)方法,有效地提高了无网格点云卫星点的有序性,提高了GPU算法的并行加速效率。最后,基于所提算法,成功地研制了相应的无网格GPU计算程序,完成了对典型二维流动算例的考核验算,并成功地推广应用到了三维粘性流动问题的求解。所有算例都取得了GPU加速效果,相比单核CPU,显式算法GPU加速最多达85倍,隐式算法还可进一步提升2到5倍,同时算例也表明,所提核函数合并和MLPRO排序等措施也能显著提升算法效率。
【学位授予单位】:南京航空航天大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:O35;TP332
【图文】:

计算性能,并行算法,内存访问,带宽


面向求解三维复杂流动问题的 GPU 并行算法及其应用研究而应运而生,并得到了迅速发展。图 1.1 显示了 2003 年至 2016 年间 NVIDIAGPU 和 Intel CPU的单双精度浮点运算峰值性能和内存访问带宽的发展情况[86]。从浮点运算峰值性能上看,GPU达到同时期 CPU 的 5-10 倍;从内存带宽上看,GPU 为同时期 CPU 的 3 倍以上。强大的运算能力一定程度上反映了 GPU 并行算法的加速潜能。

有限体积法,网格单元,类型,流动问题


面向求解三维复杂流动问题的 GPU 并行算法及其应用研究杂外形流动问题。因此,本文基于非结构网格数据结构发展有限体积 GP格单元类型有二维的三角形、四边形网格单元和三维的四面体、六面体单元,如图 2.1 所示。(a)三角形单元 (b)四边形单元 (c)四面体单元

示意图,有限体积法,格点,格式


三棱柱单元 (e)金字塔单元 (f)六面图 2.1 有限体积法网格单元类型形式不同,可将有限体积法分为格点格式(cell-)。本文采用的是格点格式有限体积法,其控制离散的网格顶点, , 1, ,6iE i 表示网格单元元的中心点和所有网格边的中心点依次相连所构

【参考文献】

相关期刊论文 前9条

1 蒲赛虎;陈红全;;处理动边界问题的无网格/直角网格混合算法[J];南京航空航天大学学报;2010年04期

2 张兵;韩景龙;;基于GPU和隐式格式的CFD并行计算方法[J];航空学报;2010年02期

3 马志华;陈红全;吴晓军;饶玲;王红;;基于局部无网格的混合算法研究[J];空气动力学学报;2008年03期

4 周季夫;钟诚文;尹世群;解建飞;张勇;;基于GPGPU的Lattice-Boltzmann数值模拟算法[J];计算机辅助设计与图形学学报;2008年07期

5 闫晓军,张玉珠,聂景旭;空间碎片超高速碰撞数值模拟的SPH方法[J];北京航空航天大学学报;2005年03期

6 吕晓斌,兰黔章,朱自强;求解Euler方程的区域分解方法与并行算法[J];计算物理;2000年04期

7 苏继超;ADI方法求解完全跨声速非定常小扰动方程[J];空气动力学学报;1990年02期

8 张涵信;无波动、无自由参数的耗散差分格式[J];空气动力学学报;1988年02期

9 罗世凤;跨音速小扰动方程的近似因式分解法[J];空气动力学学报;1983年02期

相关博士学位论文 前1条

1 马志华;自适应无网格及网格和无网格混合算法研究[D];南京航空航天大学;2008年



本文编号:2759851

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2759851.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5061b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com