面向异构体系结构的粒子输运并行算法研究
发布时间:2021-06-18 19:40
在很多物理现象中,都会使用粒子输运方程(Boltzmann方程)来描述粒子的传输过程,例如,在核反应堆中,应用输运方程计算堆芯的中子分布,进行屏蔽设计;在生物医学领域中,可以用输运理论来确定放射性治疗的剂量;在天体物理、半导体物理、等离子体物理、宇宙线簇射、气体放电物理等学科中,输运理论被用来研究中子、光子、电子和等离子等粒子的输运问题。通常有两类数值方法来求解Boltzmann输运方程。第一类是确定性方法,包括时间的差分,空间的差分方法、有限元方法,能群的多群近似,角方向的离散纵标方法、球谐函数法等。第二类是非确定性方法或称为蒙特卡罗方法,该方法通过模拟单个粒子的历史,根据许多个粒子历史的综合信息来得到想要的结果。传统的高性能计算机一般采用商用通用处理器,在构造大规模并行计算系统时将面临系统效率、功耗、系统的维护和成本等多方面的挑战。近年来,异构体系结构开始成为构造超级计算机系统的一种趋势。与传统的并行计算机系统相比,除处理器核间的多核并行及隐含于硬件的指令级并行外,异构计算系统的具有显式SIMD微向量数据级并行特征。在粒子输运实际应用问题模拟计算中,未知粒子子通量定义在能量、时间、...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:154 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 课题研究背景及意义
1.1.1 输运理论简介
1.1.2 以粒子输运模拟为代表的高性能应用面临的挑战
1.1.3 异构并行计算带来的机遇和挑战
1.1.4 研究意义
1.2 国内外研究现状
1.2.1 粒子输运的并行算法研究
1.2.2 面向异构体系结构的并行算法研究
1.3 本文的研究内容和主要贡献
1.3.1 本文的研究内容
1.3.2 本文的主要贡献
1.4 论文结构
第二章 相关工作
2.1 粒子输运模型及其数值方法
2.1.1 粒子输运的基本概念
2.1.2 输运方程的一般形式及定解条件
2.1.3 输运方程的确定性数值近似解法
2.1.4 三维笛卡尔坐标下的输运方程
2.1.5 三维笛卡尔坐标下的输运问题的差分方程
2.1.6 二维柱坐标下的输运方程
2.1.7 二维柱坐标下的输运问题的间断有限元方程
2.1.8 离散纵标方法
2.1.9 间断有限元法
2.1.10 源迭代方法
2.1.11 粒子输运的非确定性模拟
2.2 异构体系结构
2.2.1 分类、特征及趋势
2.2.2 典型的协处理单元
2.2.3 高性能计算领域异构体系结构面临的挑战
2.3 GPU 硬件架构及编程模型
第三章 基于GPU 的粒子输运三维确定性结构化网格数据级并行扫描算法
3.1 问题提出
3.2 相关研究
3.3 基于GPU 的数据级通量扫描算法
3.3.1 基本的线程级并行扫描
3.3.2 从P_n 矩中计算源项
3.3.3 求解递归的S_n 方程
3.3.4 更新来自P_n 矩的粒子通量和DSA 面流
3.3.5 其它过程
3.4 算法分析
3.4.1 并行度模型及分析
3.5 数值实验和讨论
3.5.1 实验平台和问题模型
3.5.2 基本数据级并行扫描
3.5.3 模拟的收敛性
3.5.4 不进行通量修正的性能
3.5.5 S_n 递归方程并行化的效果
3.5.6 GPU 和CPU 实现的细节比较
3.5.7 进行通量修正时粒子输运的性能
3.5.8 讨论
3.6 小结
第四章 基于GPU 的粒子输运二维确定性非结构化网格数据级并行扫描算法
4.1 问题提出
4.2 相关研究
4.3 基于GPU 的数据级扫描算法
4.3.1 预扫描算法:确定扫描顺序
4.3.2 映射并行通量扫描计算到GPU 线程执行模型
4.3.3 其它过程
4.3.4 优化
4.4 算法分析
4.4.1 预扫描算法的可行性分析
4.4.2 并行度分析
4.4.3 层次式异构并行算法设计方法:从循环展开与分割的角度
4.5 数值实验和讨论
4.5.1 实验平台和问题模型
4.5.2 模拟的收敛性
4.5.3 数据级并行通量扫描算法的性质
4.5.4 性能比较
4.5.5 讨论
4.6 小结
第五章 基于GPU 的非确定性粒子输运数据级并行算法
5.1 问题提出
5.2 相关研究
5.3 基于GPU 的数据级并行MC 模拟算法
5.3.1 算法总体流程
5.3.2 并行访存冲突的消除:引入新型数据结构
5.3.3 GPU 多线程并行
5.3.4 基于GPU 的并行伪随机数发生器
5.3.5 基于GPU 的方向角分布抽样
5.3.6 优化
5.4 算法分析
5.4.1 存储事务模型
5.4.2 面向异构体系结构的算法设计优化方法简述
5.5 数值实验和讨论
5.5.1 测试平台
5.5.2 并行伪随机数测试结果
5.5.3 角分布抽样测试结果
5.5.4 MCNP-GPU 测试结果
5.5.5 讨论
5.6 小结
第六章 面向异构体系结构可扩展粒子输运并行框架设计与实现
6.1 问题提出
6.2 相关研究
6.3 面向异构体系结构的可扩展粒子输运并行框架设计
6.3.1 层次结构
6.3.2 异构类型定义
6.3.3 数据结构设计
6.3.4 模块设计
6.3.5 接口设计
6.3.6 代码和文档
6.4 应用示例
6.4.1 Sweep3D-multiGPU
6.4.2 Hybrid-EP
6.5 小结
第七章 结束语
7.1 工作总结
7.2 工作展望
致谢
参考文献
作者在学期间取得的学术成果
【参考文献】:
期刊论文
[1]数据库[J]. 电器. 2011(11)
[2]Parallel implementation of fast multipole method based on JASMIN[J]. CAO XiaoLin 1,2,MO ZeYao 1,2,LIU Xu 1,XU XiaoWen 1 & ZHANG AiQing 1 1 High Performance Computational Center in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;2 Laboratory of Computational Physics in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China. Science China(Information Sciences). 2011(04)
[3]Cell处理器上软件缓存的设计与实现[J]. 孙守航,杨灿群. 计算机工程. 2011(02)
[4]粒子输运蒙特卡罗模拟现状概述[J]. 邓力,李刚. 计算物理. 2010(06)
[5]非结构网格粒子输运Sn并行算法[J]. 迟利华,刘杰,田平. 计算机工程与科学. 2010(10)
[6]基于JASMIN框架的快速多极子并行解法器[J]. 曹小林,莫则尧,刘旭,徐小文,张爱清. 中国科学:信息科学. 2010(09)
[7]Efficient Monte Carlo-based options pricing on graphics processors and its optimizations[J]. 刘力,刘利. Science China(Information Sciences). 2010(09)
[8]基于PVM的MCNP程序的并行计算解决方案[J]. 王文炜,凌球,杨磊,黄千红. 核电子学与探测技术. 2010(08)
[9]基于FPGA内置RAM的抗辐射有限状态机设计[J]. 孙兆伟,刘源,徐国栋,孙蕊. 航空学报. 2010(05)
[10]一种求解输运方程的并行调度算法[J]. 周涤宇,刘杰. 计算机学报. 2010(05)
博士论文
[1]高维中子输运方程的离散格式与并行算法研究[D]. 阳述林.中国工程物理研究院 2003
硕士论文
[1]粒子输运的确定性问题并行算法研究[D]. 周涤宇.国防科学技术大学 2007
[2]二维输运方程离散纵标方法的并行计算方法研究[D]. 陈静.国防科学技术大学 2005
[3]MVC模式在系统框架设计中的研究与应用[D]. 杜爱华.西安建筑科技大学 2005
本文编号:3237264
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:154 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 课题研究背景及意义
1.1.1 输运理论简介
1.1.2 以粒子输运模拟为代表的高性能应用面临的挑战
1.1.3 异构并行计算带来的机遇和挑战
1.1.4 研究意义
1.2 国内外研究现状
1.2.1 粒子输运的并行算法研究
1.2.2 面向异构体系结构的并行算法研究
1.3 本文的研究内容和主要贡献
1.3.1 本文的研究内容
1.3.2 本文的主要贡献
1.4 论文结构
第二章 相关工作
2.1 粒子输运模型及其数值方法
2.1.1 粒子输运的基本概念
2.1.2 输运方程的一般形式及定解条件
2.1.3 输运方程的确定性数值近似解法
2.1.4 三维笛卡尔坐标下的输运方程
2.1.5 三维笛卡尔坐标下的输运问题的差分方程
2.1.6 二维柱坐标下的输运方程
2.1.7 二维柱坐标下的输运问题的间断有限元方程
2.1.8 离散纵标方法
2.1.9 间断有限元法
2.1.10 源迭代方法
2.1.11 粒子输运的非确定性模拟
2.2 异构体系结构
2.2.1 分类、特征及趋势
2.2.2 典型的协处理单元
2.2.3 高性能计算领域异构体系结构面临的挑战
2.3 GPU 硬件架构及编程模型
第三章 基于GPU 的粒子输运三维确定性结构化网格数据级并行扫描算法
3.1 问题提出
3.2 相关研究
3.3 基于GPU 的数据级通量扫描算法
3.3.1 基本的线程级并行扫描
3.3.2 从P_n 矩中计算源项
3.3.3 求解递归的S_n 方程
3.3.4 更新来自P_n 矩的粒子通量和DSA 面流
3.3.5 其它过程
3.4 算法分析
3.4.1 并行度模型及分析
3.5 数值实验和讨论
3.5.1 实验平台和问题模型
3.5.2 基本数据级并行扫描
3.5.3 模拟的收敛性
3.5.4 不进行通量修正的性能
3.5.5 S_n 递归方程并行化的效果
3.5.6 GPU 和CPU 实现的细节比较
3.5.7 进行通量修正时粒子输运的性能
3.5.8 讨论
3.6 小结
第四章 基于GPU 的粒子输运二维确定性非结构化网格数据级并行扫描算法
4.1 问题提出
4.2 相关研究
4.3 基于GPU 的数据级扫描算法
4.3.1 预扫描算法:确定扫描顺序
4.3.2 映射并行通量扫描计算到GPU 线程执行模型
4.3.3 其它过程
4.3.4 优化
4.4 算法分析
4.4.1 预扫描算法的可行性分析
4.4.2 并行度分析
4.4.3 层次式异构并行算法设计方法:从循环展开与分割的角度
4.5 数值实验和讨论
4.5.1 实验平台和问题模型
4.5.2 模拟的收敛性
4.5.3 数据级并行通量扫描算法的性质
4.5.4 性能比较
4.5.5 讨论
4.6 小结
第五章 基于GPU 的非确定性粒子输运数据级并行算法
5.1 问题提出
5.2 相关研究
5.3 基于GPU 的数据级并行MC 模拟算法
5.3.1 算法总体流程
5.3.2 并行访存冲突的消除:引入新型数据结构
5.3.3 GPU 多线程并行
5.3.4 基于GPU 的并行伪随机数发生器
5.3.5 基于GPU 的方向角分布抽样
5.3.6 优化
5.4 算法分析
5.4.1 存储事务模型
5.4.2 面向异构体系结构的算法设计优化方法简述
5.5 数值实验和讨论
5.5.1 测试平台
5.5.2 并行伪随机数测试结果
5.5.3 角分布抽样测试结果
5.5.4 MCNP-GPU 测试结果
5.5.5 讨论
5.6 小结
第六章 面向异构体系结构可扩展粒子输运并行框架设计与实现
6.1 问题提出
6.2 相关研究
6.3 面向异构体系结构的可扩展粒子输运并行框架设计
6.3.1 层次结构
6.3.2 异构类型定义
6.3.3 数据结构设计
6.3.4 模块设计
6.3.5 接口设计
6.3.6 代码和文档
6.4 应用示例
6.4.1 Sweep3D-multiGPU
6.4.2 Hybrid-EP
6.5 小结
第七章 结束语
7.1 工作总结
7.2 工作展望
致谢
参考文献
作者在学期间取得的学术成果
【参考文献】:
期刊论文
[1]数据库[J]. 电器. 2011(11)
[2]Parallel implementation of fast multipole method based on JASMIN[J]. CAO XiaoLin 1,2,MO ZeYao 1,2,LIU Xu 1,XU XiaoWen 1 & ZHANG AiQing 1 1 High Performance Computational Center in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;2 Laboratory of Computational Physics in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China. Science China(Information Sciences). 2011(04)
[3]Cell处理器上软件缓存的设计与实现[J]. 孙守航,杨灿群. 计算机工程. 2011(02)
[4]粒子输运蒙特卡罗模拟现状概述[J]. 邓力,李刚. 计算物理. 2010(06)
[5]非结构网格粒子输运Sn并行算法[J]. 迟利华,刘杰,田平. 计算机工程与科学. 2010(10)
[6]基于JASMIN框架的快速多极子并行解法器[J]. 曹小林,莫则尧,刘旭,徐小文,张爱清. 中国科学:信息科学. 2010(09)
[7]Efficient Monte Carlo-based options pricing on graphics processors and its optimizations[J]. 刘力,刘利. Science China(Information Sciences). 2010(09)
[8]基于PVM的MCNP程序的并行计算解决方案[J]. 王文炜,凌球,杨磊,黄千红. 核电子学与探测技术. 2010(08)
[9]基于FPGA内置RAM的抗辐射有限状态机设计[J]. 孙兆伟,刘源,徐国栋,孙蕊. 航空学报. 2010(05)
[10]一种求解输运方程的并行调度算法[J]. 周涤宇,刘杰. 计算机学报. 2010(05)
博士论文
[1]高维中子输运方程的离散格式与并行算法研究[D]. 阳述林.中国工程物理研究院 2003
硕士论文
[1]粒子输运的确定性问题并行算法研究[D]. 周涤宇.国防科学技术大学 2007
[2]二维输运方程离散纵标方法的并行计算方法研究[D]. 陈静.国防科学技术大学 2005
[3]MVC模式在系统框架设计中的研究与应用[D]. 杜爱华.西安建筑科技大学 2005
本文编号:3237264
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3237264.html