基于异构众核处理器的有限差分算法并行优化
发布时间:2021-06-10 16:32
有限差分算法一直都是偏微分求解过程中的核心求解方法,但是在面对大规模科学计算应用时,普通处理器的计算效率难以满足应用的需求。“神威·太湖之光”超级计算系统,是世界上第一个性能超过100Pflop/s的超级计算机系统,内部集成了40960个申威26010异构众核处理器。申威26010异构众核处理器具有独特的系统架构。目前,针对有限差分算法的计算,还没有一种优化方案可以完全发挥申威26010异构众核处理器高超的计算性能。为了提高有限差分法求解的效率,本文基于“神威·太湖之光”超级计算机系统,针对地震波正演模拟与通用地球系统模式中以有限差分法为核心计算函数,存在并行效率过低的问题,设计出了多种多级异构并行优化方案。本文根据申威26010异构处理器的架构特点,分析“神威·太湖之光”超级计算系统在处理有限差分算法相关的密集型算法时的主要性能瓶颈。研究了基于“神威·太湖之光”超级计算系统上的有限差分方法的多级并行优化。针对并行过程中出呈现的MPI消息传递效率低、处理器带宽造成通信效率低下、处理大规模数据LDM空间无法满足计算需求等问题,研究了MPI、Sunway Athread、SIMD向量化等并...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
三维差分方程错网格示意图
异步掩盖操作时钟周期
逆掩推覆体构造模型
【参考文献】:
期刊论文
[1]一种新型的高阶时域有限差分方法[J]. 许杰,徐珂,黄志祥. 电子与信息学报. 2020(02)
[2]基于GPU加速和随机边界的3D弹性波逆时偏移算法[J]. 王玉凤. 西部资源. 2019(06)
[3]面向神威·太湖之光的国产异构众核处理器OpenCL编译系统[J]. 伍明川,黄磊,刘颖,何先波,冯晓兵. 计算机学报. 2018(10)
[4]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[5]三维声波方程正演多级异构并行算法设计与实现[J]. 何香,周明忠,刘鑫. 计算机应用与软件. 2014(01)
[6]多GPU协同三维叠前逆时偏移方法研究与应用[J]. 唐祥功,匡斌,杜继修,孟祥宾,隋志强,单联瑜,王华忠. 石油地球物理勘探. 2013(06)
[7]三维逆时偏移GPU/CPU机群实现方案研究[J]. 刘守伟,王华忠,陈生昌,孔祥宁. 地球物理学报. 2013(10)
[8]地震叠前逆时偏移算法的CPU/GPU实施对策[J]. 李博,刘红伟,刘国峰,佟小龙,刘洪,郭建,裴江云. 地球物理学报. 2010(12)
[9]地震叠前逆时偏移高阶有限差分算法及GPU实现[J]. 刘红伟,李博,刘洪,佟小龙,刘钦. 地球物理学报. 2010(07)
[10]高精度瑞雷波有限差分数值模拟及波场分析[J]. 张大洲,熊章强,顾汉明. 地球物理学进展. 2009(04)
博士论文
[1]基于申威众核架构的启发式算法的异构并行研究[D]. 刘垚.华东师范大学 2019
硕士论文
[1]面向申威众核架构的GROMACS并行实现与性能优化[D]. 余洋.中国科学技术大学 2018
[2]面向国产SW26010众核处理器的科学计算核心深度优化研究[D]. 许志耿.上海交通大学 2018
本文编号:3222730
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
三维差分方程错网格示意图
异步掩盖操作时钟周期
逆掩推覆体构造模型
【参考文献】:
期刊论文
[1]一种新型的高阶时域有限差分方法[J]. 许杰,徐珂,黄志祥. 电子与信息学报. 2020(02)
[2]基于GPU加速和随机边界的3D弹性波逆时偏移算法[J]. 王玉凤. 西部资源. 2019(06)
[3]面向神威·太湖之光的国产异构众核处理器OpenCL编译系统[J]. 伍明川,黄磊,刘颖,何先波,冯晓兵. 计算机学报. 2018(10)
[4]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[5]三维声波方程正演多级异构并行算法设计与实现[J]. 何香,周明忠,刘鑫. 计算机应用与软件. 2014(01)
[6]多GPU协同三维叠前逆时偏移方法研究与应用[J]. 唐祥功,匡斌,杜继修,孟祥宾,隋志强,单联瑜,王华忠. 石油地球物理勘探. 2013(06)
[7]三维逆时偏移GPU/CPU机群实现方案研究[J]. 刘守伟,王华忠,陈生昌,孔祥宁. 地球物理学报. 2013(10)
[8]地震叠前逆时偏移算法的CPU/GPU实施对策[J]. 李博,刘红伟,刘国峰,佟小龙,刘洪,郭建,裴江云. 地球物理学报. 2010(12)
[9]地震叠前逆时偏移高阶有限差分算法及GPU实现[J]. 刘红伟,李博,刘洪,佟小龙,刘钦. 地球物理学报. 2010(07)
[10]高精度瑞雷波有限差分数值模拟及波场分析[J]. 张大洲,熊章强,顾汉明. 地球物理学进展. 2009(04)
博士论文
[1]基于申威众核架构的启发式算法的异构并行研究[D]. 刘垚.华东师范大学 2019
硕士论文
[1]面向申威众核架构的GROMACS并行实现与性能优化[D]. 余洋.中国科学技术大学 2018
[2]面向国产SW26010众核处理器的科学计算核心深度优化研究[D]. 许志耿.上海交通大学 2018
本文编号:3222730
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3222730.html