基于ROCm并行探测部分子级联中的首次碰撞
发布时间:2022-02-15 23:46
在超相对论重离子碰撞过程中的部分子级联过程,可以认为是由一系列的两夸克胶子碰撞所组成,但仅利用CPU串行仿真该过程用时较长。本次仿真创新性地首次采用ROCm并行技术在AMD Vega10上对首次两夸克胶子碰撞的探测实现了并行化处理,计算出并行程序探测到的首次两夸克胶子碰撞所需的时间,及其对应的夸克胶子对序号。另外分别采用CUDA平台的NVIDIA的P100和OpenMP平台的Intel Xeon CPU E5-2690进行验证。关于第一次碰撞的探测,在上述三个平台上得到相同的结果。相对于基于CPU串行探测首次碰撞而言,采用ROCm并行探测超相对论重离子中部分子级联中的首次碰撞,可获得最高加速比,可达18600倍。
【文章来源】:计算机仿真. 2020,37(03)北大核心
【文章页数】:4 页
【部分图文】:
并行算法流程图
图2 串行算法流程图
从图3不同线程数的程序用时不难看出,在OpenMP平台下随着使用线程数的增加,算法用时线性减少,但在使用12个以上的线程时,加速的幅度下降,并趋于稳定,不随使用线程数的增加而线性下降。即使运用了CPU的所有线程,也无法赶上ROCm平台和CUDA平台的计算处理能力。5 结束语
【参考文献】:
期刊论文
[1]CUDA并行计算的应用研究[J]. 董荦,葛万成,陈康力. 信息技术. 2010(04)
[2]CUDA高性能计算并行编程[J]. 李波,赵华成,张敏芳. 微型电脑应用. 2009(09)
硕士论文
[1]OpenMP并行编程模型与性能优化方法的研究及应用[D]. 游佐勇.成都理工大学 2011
本文编号:3627497
【文章来源】:计算机仿真. 2020,37(03)北大核心
【文章页数】:4 页
【部分图文】:
并行算法流程图
图2 串行算法流程图
从图3不同线程数的程序用时不难看出,在OpenMP平台下随着使用线程数的增加,算法用时线性减少,但在使用12个以上的线程时,加速的幅度下降,并趋于稳定,不随使用线程数的增加而线性下降。即使运用了CPU的所有线程,也无法赶上ROCm平台和CUDA平台的计算处理能力。5 结束语
【参考文献】:
期刊论文
[1]CUDA并行计算的应用研究[J]. 董荦,葛万成,陈康力. 信息技术. 2010(04)
[2]CUDA高性能计算并行编程[J]. 李波,赵华成,张敏芳. 微型电脑应用. 2009(09)
硕士论文
[1]OpenMP并行编程模型与性能优化方法的研究及应用[D]. 游佐勇.成都理工大学 2011
本文编号:3627497
本文链接:https://www.wllwen.com/kejilunwen/wulilw/3627497.html