多GPU并行计算及其在粒子模拟中的应用
发布时间:2017-07-15 19:19
本文关键词:多GPU并行计算及其在粒子模拟中的应用
更多相关文章: Multi-GPUs 统一内存 CUDA 粒子模拟
【摘要】:粒子模拟(particle-in-cell,PIC)方法是研究带电粒子运动规律的重要方法。伴随着计算机技术的高速发展,PIC方法自诞生以来便受到国内外诸多研究机构青睐,应用领域十分广泛,已然成为一种重要的研究手段。但随着科学计算的发展,计算规模急剧增大,传统的基于中央处理器(Central Processing Unit,CPU)的计算机受制于物理结构和能耗等问题,已经无法满足计算要求。与CPU不同,图形处理器(Graphics Processor Unit,GPU)采用众核结构,内部多达几千个计算核心,每个计算核心都相当于一个单核处理器,这使得GPU拥有强大的计算能力。随着GPU的快速发展,其应用领域延伸到高性能计算(High Performance Compute,HPC)领域。如何将CPU和GPU结合起来,发挥各自优秀的计算能力,已然成为HPC领域共同研究的关键点,围绕GPU设计的加速核心算法的执行逐渐成为HPC领域一个重要的发展趋势。论文主要是在个人计算机中研究Multi-GPUs并行计算技术,并基于Multi-GPUs实现激光与等离子体互作用物理过程的并行模拟,为实现GPU集群模拟奠定前期的实践基础。文中主要研究了基于GPU组成的不同计算架构系统应用优势,及其在粒子模拟的并行化应用。阐述了国内外对采用GPU技术的粒子模拟研究的最新成果,总结了CUDA的技术要点及其在不同GPU计算系统中的技术优势。论文中进一步基于激光与等离子体互作用的数理模型和实验室开发的LPICMCC++求解器软件和串行实现算法,总结和提炼Multi-GPUs并行实现算法。采用业内最新推出的Uuified Memory(统一内存)技术,对LPICMCC++求解器不同模块的代码进行改写,移植到并行计算环境中进行加速计算。论文最后将激光与等离子互作用的整个物理过程在Multi-GPUs并行环境下进行了模拟验证,以串行LPICMCC++求解器的结果为参照数据,对整个过程中不同周期的数据进行的对比,以验证Multi-GPUs并行实现的正确性。通过对不同粒子状态下的计算时间和结果,总结Multi-GPUs并行实现的加速比,并说明结果中的产生误差的原因。
【关键词】:Multi-GPUs 统一内存 CUDA 粒子模拟
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP338.6
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 绪论10-16
- 1.1 论文选题背景及意义10-11
- 1.2 GPU技术的发展现状11-13
- 1.3 粒子模拟的并行发展现状13-14
- 1.4 本文的主要工作与创新14
- 1.5 本论文的结构安排14-16
- 第二章 GPU并行计算技术16-29
- 2.1 早期的GPGPU编程16
- 2.2 CUDA的诞生与发展16-21
- 2.2.1 CUDA基本介绍16-18
- 2.2.2 CUDA寻址技术的发展18-21
- 2.3 单GPU异构编程系统21-24
- 2.3.1 单GPU异构编程物理结构21-22
- 2.3.2 单GPU CUDA编程模型22-24
- 2.4 Multi-GPUs异构编程系统24-28
- 2.4.1 Multi-GPUs异构编程物理结构24-25
- 2.4.2 Multi-GPUs CUDA编程模型25-28
- 2.5 本章小结28-29
- 第三章 LPICMCC++及其并行实现方案介绍29-40
- 3.1 LPICMCC++求解器及数理模型概述29-31
- 3.1.1 LPICMCC++求解器概述29
- 3.1.2 LPICMCC++求解器数理模型29-31
- 3.2 LPICMCC++串行程序实现31-33
- 3.2.1 PIC/MCC模拟流程31-32
- 3.2.2 LPICMCC++程序热点剖析32-33
- 3.2.3 改进后的程序数据结构33
- 3.3 LPICMCC++的单GPU并行程序概述33-36
- 3.3.1 单GPU并行模拟流程33-34
- 3.3.2 单GPU并行调用模式34-35
- 3.3.3 单GPU并行模式分析35-36
- 3.4 LPICMCC++的Multi-GPUs并行的实现36-39
- 3.4.1 Multi-GPUs并行模拟流程36-37
- 3.4.2 Multi-GPUs模式下数据调用37
- 3.4.3 Multi-GPUs模式下程序执行模式37-39
- 3.5 本章小结39-40
- 第四章 LPICMCC++的Multi-GPUs并行实现40-47
- 4.1 引言40
- 4.2 粒子加速模块并行实现40-42
- 4.2.1 CPU粒子加速模块模拟算法40-42
- 4.2.2 粒子加速模块Multi-GPUs并行实现42
- 4.3 场模块并行实现42-46
- 4.3.1 场模块模拟算法42-45
- 4.3.2 场模块Multi-GPUs并行实现45-46
- 4.4 本章小结46-47
- 第五章 并行实现与结果分析47-59
- 5.1 实验平台和实验参数设定47-49
- 5.1.1 实验平台介绍47-48
- 5.1.2 实验参数设定48-49
- 5.2 结果验证与对比49-56
- 5.2.1 不同周期下的结果验证49-55
- 5.2.2 误差分析55-56
- 5.3 加速比56-58
- 5.3.1 粒子加速模块的加速比56-57
- 5.3.2 场模块的加速比57-58
- 5.4 本章小结58-59
- 第六章 总结59-60
- 致谢60-61
- 参考文献61-64
【相似文献】
中国期刊全文数据库 前10条
1 何牧君;郭力;严历;;大规模并行粒子模拟系统通信性能优化研究与分析[J];计算机与应用化学;2008年09期
2 郭卫卫;郭力;;大规模粒子模拟并行前处理系统的设计与实现[J];计算机与应用化学;2010年12期
3 褚晓锐;;电子回旋脉塞等离子体的粒子模拟[J];山西大学学报(自然科学版);2009年03期
4 刘大刚;周俊;杨超;;粒子模拟中的电磁场算法[J];强激光与粒子束;2010年06期
5 廖臣;刘大刚;刘盛纲;;三维电磁粒子模拟并行计算的研究[J];物理学报;2009年10期
6 卓红斌,常文蔚,徐涵,马燕云;低密度等离子体融断开关的粒子模拟研究[J];强激光与粒子束;2001年04期
7 钱波;褚晓锐;施智雄;杨中海;;电子回旋脉塞等离子体粒子模拟的理论研究[J];山西大学学报(自然科学版);2009年01期
8 刘大刚;祝大军;周俊;胡e,
本文编号:545377
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/545377.html