面向应用的加速器增强型异构系统大规模并行计算关键技术研究
发布时间:2021-01-07 04:44
大规模科学与工程计算已经成为当前科学研究不可或缺的重要手段,极大地推动了科技的发展和人类的进步。当前超级计算机已经进入千万亿次(Peta-scale)浮点计算能力的时代,但诸如高能核物理、材料化学、生命科学等一系列挑战性计算应用表现出对百亿亿次级(Exascale)计算能力的超高需求。由于GPU、MIC(又称Xeon Phi coprocessor)等加速器的性能功耗比优势,基于加速器搭建异构超级计算机已经成为高性能计算领域从P级到E级发展的重要趋势,如基于NVIDIA GPU加速器的天河-1A,和基于Intel新型MIC加速器的天河-2。领域应用软件是发挥E级计算系统能力的保障。然而,异构体系结构在缓解通信墙、可靠性墙和能耗墙的同时,加剧了编程墙。因此,如何快速地开发大规模并行应用程序,高效率地发挥当前高性能异构系统的性能,已经成为当前异构并行计算研究面临的一个挑战性问题。我国自主研发高性能超级计算机系统的能力已达到国际顶尖水平,然而与其不相匹配的是,我国的高性能计算应用软件开发的水平还远远落后于国际先进水平。本文面向真实的应用领域,根据课题研究和工程项目实际结合的需要选取了3个具有...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:162 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 加速器增强型异构计算系统
1.1.2 大规模应用对高性能计算的迫切需求
1.1.3 应用领域的异构大规模并行计算面临的挑战
1.2 研究现状
1.2.1 典型大规模异构系统结构
1.2.2 大规模异构系统编程模型
1.2.3 基于大规模异构系统的应用
1.3 本文研究内容和贡献
1.4 论文结构
第二章 面向贝叶斯进化分析的大规模异构混合计算
2.1 引言
2.2 背景
2.2.1 MrBayes概述
2.2.2 同时利用CPU和GPU的挑战
2.3 方法
2.3.1 oMC3算法
2.3.2 负载划分策略
2.4 结果和讨论
2.4.1 实验设置
2.4.2 单计算节点上的性能
2.4.3 验证负载划分策略
2.4.4 多节点扩展性
2.5 小结
第三章 基于GPU阵列计算的组织级心电模拟性能研究
3.1 引言
3.2 数学模型
3.3 数值方法
3.4 并行实现
3.4.1 使用多个GPU
3.4.2 GPU上的计算Kernel
3.5 实验与性能分析
3.5.1 模拟设置和结果
3.5.2 单GPU性能与单CPU核性能比较
3.5.3 多GPU上的性能
3.5.4 通信开销的讨论
3.5.5 预测时间开销
3.6 小结
第四章 接近纳米级精度的钙动力模拟并行计算方案
4.1 引言
4.2 应用描述
4.2.1 数学模型
4.2.2 数值方法
4.3 目标体系结构
4.4 实现和优化
4.4.1 整体策略
4.4.2 单协处理器利用
4.4.3 单结点利用
4.4.4 多节点效率
4.5 性能研究
4.5.1 单协处理器性能
4.5.2 单结点的性能
4.5.3 弱扩展性
4.5.4 强扩展性
4.6 模拟结果
4.7 小结
第五章 面向模板计算的新型异构并行编程框架
5.1 引言
5.2 背景
5.2.1 目标体系结构
5.2.2 编程模型和模式
5.3 相关研究
5.4 编程框架设计
5.4.1 混合并行编程框架整体设计
5.4.2 负载划分策略
5.4.3 通信优化设计
5.5 实现示例
5.5.1 基于Pragma的实现
5.5.2 基于COI和SCIF的实现
5.6 实验和结果
5.6.1 实验设置
5.6.2 带宽测试
5.6.3 应用性能对比测试
5.6.4 负载划分测试
5.7 小结
第六章 结论与展望
6.1 工作总结
6.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
【参考文献】:
博士论文
[1]面向应用的GPU并行技术研究[D]. 薛云刚.国防科技大学 2017
[2]面向新型异构众核系统的多设备协同并行计算关键技术研究[D]. 万烂军.湖南大学 2016
[3]基于高性能协处理器的粒子输运模拟加速关键技术研究[D]. 王庆林.国防科学技术大学 2016
[4]面向应用的GPU并行计算关键技术研究[D]. 苏华友.国防科学技术大学 2014
硕士论文
[1]格子玻尔兹曼方法的众核平台并行计算与优化研究[D]. 金远洋.国防科学技术大学 2017
[2]基于CPU-GPU异构并行计算的刀具路径规划方法研究[D]. 黎振东.杭州电子科技大学 2017
本文编号:2961938
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:162 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 加速器增强型异构计算系统
1.1.2 大规模应用对高性能计算的迫切需求
1.1.3 应用领域的异构大规模并行计算面临的挑战
1.2 研究现状
1.2.1 典型大规模异构系统结构
1.2.2 大规模异构系统编程模型
1.2.3 基于大规模异构系统的应用
1.3 本文研究内容和贡献
1.4 论文结构
第二章 面向贝叶斯进化分析的大规模异构混合计算
2.1 引言
2.2 背景
2.2.1 MrBayes概述
2.2.2 同时利用CPU和GPU的挑战
2.3 方法
2.3.1 oMC3算法
2.3.2 负载划分策略
2.4 结果和讨论
2.4.1 实验设置
2.4.2 单计算节点上的性能
2.4.3 验证负载划分策略
2.4.4 多节点扩展性
2.5 小结
第三章 基于GPU阵列计算的组织级心电模拟性能研究
3.1 引言
3.2 数学模型
3.3 数值方法
3.4 并行实现
3.4.1 使用多个GPU
3.4.2 GPU上的计算Kernel
3.5 实验与性能分析
3.5.1 模拟设置和结果
3.5.2 单GPU性能与单CPU核性能比较
3.5.3 多GPU上的性能
3.5.4 通信开销的讨论
3.5.5 预测时间开销
3.6 小结
第四章 接近纳米级精度的钙动力模拟并行计算方案
4.1 引言
4.2 应用描述
4.2.1 数学模型
4.2.2 数值方法
4.3 目标体系结构
4.4 实现和优化
4.4.1 整体策略
4.4.2 单协处理器利用
4.4.3 单结点利用
4.4.4 多节点效率
4.5 性能研究
4.5.1 单协处理器性能
4.5.2 单结点的性能
4.5.3 弱扩展性
4.5.4 强扩展性
4.6 模拟结果
4.7 小结
第五章 面向模板计算的新型异构并行编程框架
5.1 引言
5.2 背景
5.2.1 目标体系结构
5.2.2 编程模型和模式
5.3 相关研究
5.4 编程框架设计
5.4.1 混合并行编程框架整体设计
5.4.2 负载划分策略
5.4.3 通信优化设计
5.5 实现示例
5.5.1 基于Pragma的实现
5.5.2 基于COI和SCIF的实现
5.6 实验和结果
5.6.1 实验设置
5.6.2 带宽测试
5.6.3 应用性能对比测试
5.6.4 负载划分测试
5.7 小结
第六章 结论与展望
6.1 工作总结
6.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
【参考文献】:
博士论文
[1]面向应用的GPU并行技术研究[D]. 薛云刚.国防科技大学 2017
[2]面向新型异构众核系统的多设备协同并行计算关键技术研究[D]. 万烂军.湖南大学 2016
[3]基于高性能协处理器的粒子输运模拟加速关键技术研究[D]. 王庆林.国防科学技术大学 2016
[4]面向应用的GPU并行计算关键技术研究[D]. 苏华友.国防科学技术大学 2014
硕士论文
[1]格子玻尔兹曼方法的众核平台并行计算与优化研究[D]. 金远洋.国防科学技术大学 2017
[2]基于CPU-GPU异构并行计算的刀具路径规划方法研究[D]. 黎振东.杭州电子科技大学 2017
本文编号:2961938
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2961938.html