使用GTC-P应用评估曙光E级原型机的性能
发布时间:2021-02-12 09:53
曙光E级原型机是我国"十三五"计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,对比了GTC-P在海光CPU和DCU与Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型机的多结点上进行了扩展性分析。性能评估工作反映了高性能计算应用在曙光E级原型机上的实际运行性能。
【文章来源】:计算机工程与科学. 2020,42(01)北大核心
【文章页数】:7 页
【文章目录】:
1 引言
2 背景介绍
2.1 GTC-P应用
2.2 曙光E级原型机
2.2.1 总体架构
2.2.2 海光CPU
2.2.3 海光DCU
3 基准测试结果
3.1 双精度浮点计算能力
3.2 访存带宽与延迟
4 同构并行GTC-P
4.1 移植
4.2 单核性能分析
4.3 多核性能分析
4.4 多结点扩展性分析
5 异构并行GTC-P
5.1 移植
5.2 性能分析
6 相关工作
7 结束语
【参考文献】:
期刊论文
[1]太湖之光上利用OpenACC移植和优化GTC-P[J]. 王一超,林新华,蔡林金,Tang William,Ethier Stephane,王蓓,施忠伟,松岗聪. 计算机研究与发展. 2018(04)
本文编号:3030671
【文章来源】:计算机工程与科学. 2020,42(01)北大核心
【文章页数】:7 页
【文章目录】:
1 引言
2 背景介绍
2.1 GTC-P应用
2.2 曙光E级原型机
2.2.1 总体架构
2.2.2 海光CPU
2.2.3 海光DCU
3 基准测试结果
3.1 双精度浮点计算能力
3.2 访存带宽与延迟
4 同构并行GTC-P
4.1 移植
4.2 单核性能分析
4.3 多核性能分析
4.4 多结点扩展性分析
5 异构并行GTC-P
5.1 移植
5.2 性能分析
6 相关工作
7 结束语
【参考文献】:
期刊论文
[1]太湖之光上利用OpenACC移植和优化GTC-P[J]. 王一超,林新华,蔡林金,Tang William,Ethier Stephane,王蓓,施忠伟,松岗聪. 计算机研究与发展. 2018(04)
本文编号:3030671
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3030671.html