基于神威平台的格点QCD数值模拟计算的实现与优化
发布时间:2021-10-06 15:54
格点QCD(Lattice quantum chromodynamics)是用格点量子场论研究量子色动力学(quantum chromodynamics)的一种主流非微扰理论计算方法。它通过将场变量定义在四维网格中并进行数值模拟计算,测量由夸克与胶子构成的物理量。格点QCD数值模拟计算对网格中每个点进行迭代计算,来求解关键量:四维网格中夸克的传播振幅。格点QCD数值模拟计算属于高性能计算,其性能热点为dslash计算。四维空间中的点在dslash计算中要进行频繁的通信与计算,因此格点QCD数值模拟计算需要大量计算资源,通常在大规模超级计算机上进行。国产超算平台“神威·太湖之光”是世界上首台峰值性能超过100PFlops的超级计算机,已有许多高性能应用在神威平台上进行了移植优化并取得了很好的效果,并连续两年夺得高性能应用领域杰出奖项——戈登贝尔奖。由于神威平台片上异构设备异于常用的x86同构处理器或GPU异构加速卡,现有的格点QCD数值模拟计算程序无法直接在神威平台的从核阵列中使用。本文首次在神威平台中实现并优化了格点QCD数值模拟计算。本文重点从格点QCD数值模拟计算在“神威·太湖之光...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2.1?2018年6月超算榜单??
?第2章相关技术??图如图2.2所示:??M?iB?Memory?.Main?SUmory??.?I?,?.?????.J?二?^??i1?j?ummm??:1?1?—?1??m,,Lm?1?;?…丄…I?:?P'????J?;Tr ̄-';;^?::':|_p;.q??MFE?…二二?MPE?/?(R7,C〇)M?(R7,CI>?^?(R7,C2)?i-???-?(R7,C7)?>-???CPE?ciusier?CPE?caster?/??(…、[:觀湘?<?(.i?叫1湘?/?:?:?:? ̄T"?????r——f?f—?f?????1?V??'J:::;1'?::?????/?(R2,C0)?(R2,C!)?(R2,C2)m?-?????(R2,C7)?r??SI?—?-?No<????__________?'?■?一.??¥??■?/?F^\'?r^s??*????/?(RMTO)?1?(R1,CU???(R1,C2>、.????(R1,C7)??—L__?__?l—1?L—J??CPE?cl?i*ter?CPE?closler??MFE?H-flfffti?MPC?HtttH?十?1??L^rtttn?^rtrt…t;?(R〇
主核负责计算、通信或I/O等操作;主从动态并行模式是针对任务并行程序,??由主核对任务进行调度,从核负责任务计算并回写计算结果。四种主从计算模式??如图2.3所示:?? ̄ ̄main(t?main() ̄??核心段A?亡闲?核心段A?空闲??(计算/通?IS/IO)?(计?K/iift/ro)??加速核心Kb到从核??2闲?=;)?核心段“协麵??执行完毕返回??核心段C?空闲?核心段C?空闲??(计算/通倍/|〇>?I?(计算/通馆/丨〇>?I??主从加速并行?主从协同并彳??主核?从核?主核?从檳?? ̄main()?main(} ̄??…??I??(计算/▲馆/|〇〉?空闲?)??加■心段B到从栈??计一?S?s??!--??核心段c?空闲??撕薄/通倍/?〇>:,??主核’主从异步并行从核?挪?主从动态并g核???图2.3主从计算四种模式示意图??14??
【参考文献】:
期刊论文
[1]神威太湖之光上OpenFOAM的移植与优化[J]. 孟德龙,文敏华,韦建文,林新华. 计算机科学. 2017(10)
[2]基于申威众核处理器的混合并行遗传算法[J]. 赵瑞祥,郑凯,刘垚,王肃,刘艳,沈焕学,周谦豪. 计算机应用. 2017(09)
[3]基于神威太湖之光的NAMD软件的移植与优化[J]. 姚文军,陈俊仕,苏志超,余洋,廖陈志,安虹. 计算机工程与科学. 2017(06)
[4]面向神威·太湖之光的PETSc可扩展异构并行算法及其性能优化[J]. 洪文杰,李肯立,全哲,阳王东,李克勤,郝子宇,谢向辉. 计算机学报. 2017(09)
[5]面向SIMD向量化的循环优化技术研究[J]. 高伟,徐金龙,孙回回,李敏. 信息工程大学学报. 2016(04)
[6]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[7]一种面向高性能计算的自主众核处理器结构[J]. 郑方,许勇,李宏亮,谢向辉,陈左宁. 中国科学:信息科学. 2015(04)
[8]面向高性能计算的众核处理器结构级高能效技术[J]. 郑方,张昆,邬贵明,高红光,唐勇,吕晖,过锋,李宏亮,谢向辉,陈左宁. 计算机学报. 2014(10)
[9]面向异构众核从核的数学函数库访存优化方法[J]. 许瑾晨,郭绍忠,黄永忠,王磊. 计算机科学. 2014(06)
[10]生物大分子的分子动力学模拟过程在百万亿次集群上的部署优化[J]. 潘龙强,耿存亮,慕宇光,刘鑫,胡毅,潘景山,周亚滨,龚斌,王禄山. 山东大学学报(理学版). 2012(07)
硕士论文
[1]HPCG在多核/众核平台上的实现与优化[D]. 廖陈志.中国科学技术大学 2018
[2]神威·太湖之光上数据流编程模型的设计与实现[D]. 苏志超.中国科学技术大学 2018
[3]面向申威众核架构的GROMACS并行实现与性能优化[D]. 余洋.中国科学技术大学 2018
本文编号:3420319
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2.1?2018年6月超算榜单??
?第2章相关技术??图如图2.2所示:??M?iB?Memory?.Main?SUmory??.?I?,?.?????.J?二?^??i1?j?ummm??:1?1?—?1??m,,Lm?1?;?…丄…I?:?P'????J?;Tr ̄-';;^?::':|_p;.q??MFE?…二二?MPE?/?(R7,C〇)M?(R7,CI>?^?(R7,C2)?i-???-?(R7,C7)?>-???CPE?ciusier?CPE?caster?/??(…、[:觀湘?<?(.i?叫1湘?/?:?:?:? ̄T"?????r——f?f—?f?????1?V??'J:::;1'?::?????/?(R2,C0)?(R2,C!)?(R2,C2)m?-?????(R2,C7)?r??SI?—?-?No<????__________?'?■?一.??¥??■?/?F^\'?r^s??*????/?(RMTO)?1?(R1,CU???(R1,C2>、.????(R1,C7)??—L__?__?l—1?L—J??CPE?cl?i*ter?CPE?closler??MFE?H-flfffti?MPC?HtttH?十?1??L^rtttn?^rtrt…t;?(R〇
主核负责计算、通信或I/O等操作;主从动态并行模式是针对任务并行程序,??由主核对任务进行调度,从核负责任务计算并回写计算结果。四种主从计算模式??如图2.3所示:?? ̄ ̄main(t?main() ̄??核心段A?亡闲?核心段A?空闲??(计算/通?IS/IO)?(计?K/iift/ro)??加速核心Kb到从核??2闲?=;)?核心段“协麵??执行完毕返回??核心段C?空闲?核心段C?空闲??(计算/通倍/|〇>?I?(计算/通馆/丨〇>?I??主从加速并行?主从协同并彳??主核?从核?主核?从檳?? ̄main()?main(} ̄??…??I??(计算/▲馆/|〇〉?空闲?)??加■心段B到从栈??计一?S?s??!--??核心段c?空闲??撕薄/通倍/?〇>:,??主核’主从异步并行从核?挪?主从动态并g核???图2.3主从计算四种模式示意图??14??
【参考文献】:
期刊论文
[1]神威太湖之光上OpenFOAM的移植与优化[J]. 孟德龙,文敏华,韦建文,林新华. 计算机科学. 2017(10)
[2]基于申威众核处理器的混合并行遗传算法[J]. 赵瑞祥,郑凯,刘垚,王肃,刘艳,沈焕学,周谦豪. 计算机应用. 2017(09)
[3]基于神威太湖之光的NAMD软件的移植与优化[J]. 姚文军,陈俊仕,苏志超,余洋,廖陈志,安虹. 计算机工程与科学. 2017(06)
[4]面向神威·太湖之光的PETSc可扩展异构并行算法及其性能优化[J]. 洪文杰,李肯立,全哲,阳王东,李克勤,郝子宇,谢向辉. 计算机学报. 2017(09)
[5]面向SIMD向量化的循环优化技术研究[J]. 高伟,徐金龙,孙回回,李敏. 信息工程大学学报. 2016(04)
[6]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[7]一种面向高性能计算的自主众核处理器结构[J]. 郑方,许勇,李宏亮,谢向辉,陈左宁. 中国科学:信息科学. 2015(04)
[8]面向高性能计算的众核处理器结构级高能效技术[J]. 郑方,张昆,邬贵明,高红光,唐勇,吕晖,过锋,李宏亮,谢向辉,陈左宁. 计算机学报. 2014(10)
[9]面向异构众核从核的数学函数库访存优化方法[J]. 许瑾晨,郭绍忠,黄永忠,王磊. 计算机科学. 2014(06)
[10]生物大分子的分子动力学模拟过程在百万亿次集群上的部署优化[J]. 潘龙强,耿存亮,慕宇光,刘鑫,胡毅,潘景山,周亚滨,龚斌,王禄山. 山东大学学报(理学版). 2012(07)
硕士论文
[1]HPCG在多核/众核平台上的实现与优化[D]. 廖陈志.中国科学技术大学 2018
[2]神威·太湖之光上数据流编程模型的设计与实现[D]. 苏志超.中国科学技术大学 2018
[3]面向申威众核架构的GROMACS并行实现与性能优化[D]. 余洋.中国科学技术大学 2018
本文编号:3420319
本文链接:https://www.wllwen.com/kejilunwen/wulilw/3420319.html