面向异构系统的大气模式并行优化方法研究
发布时间:2021-09-04 04:32
近年来,全球气候变化和频发的极端天气现象对人类的生产生活产生了日益增长的威胁。大气数值模拟作为天气与气候研究的基本建模方法,对于气象预报和气候研究都起到了关键的作用。自第一台超级计算机部署以来,大气模式一直是超级计算机上的重要用户。随着模拟程序在模式精度、预报尺度、数据同化要求等维度的需求日益增长,大气模拟对超级计算机算力提出了更高的要求。大气模式经过数十年的发展,在由通用处理器构成的同构系统上已经有了成熟的并行方案。由于散热与功耗等诸多物理限制,基于通用CPU芯片的同构超级计算机已经无法满足性能增长的需求,基于众核处理器的异构超级计算机近年来得到了显著的发展。根据2018年11月发布的超级计算机Top500性能排行榜,目前世界上最快的七台超级计算机均采用了异构系统,其中众核处理器贡献了90%以上的算力。因此,探究大气模式在异构系统上的加速工作的需求十分紧迫。该工作从大气模式算子、核心模块算法及完整模式模拟三个层面出发,基于目前在全球最快的三台超级计算机中应用的三大类处理器(POWER CPU,Nvidia GPU,神威处理器),对于大气模式在异构系统上的优化提出了系统化的解决方案。本...
【文章来源】:清华大学北京市 211工程院校 985工程院校 教育部直属院校
【文章页数】:129 页
【学位级别】:博士
【部分图文】:
近25年来国际超级计算机计算能力发展状况及趋势(统计数据截止2018年11月,图片数据源于超级计算机性能排行榜(Top500)官方网站[3])
第2章研究现状分析第2章研究现状分析2.1基于同构超级计算机的大气方程并行优化气候变化所导致的全球变暖,极端天气频发等现象已成为制约人类生产生活,限制国民经济增长的重要问题。作为气候建模研究的关键组成部分之一,大气模拟在高性能计算中备受关注,研究更准确、更高效的大气模式以应对重大气候问题的挑战,一直以来是世界各国在科学计算领域所面对的最为重要的研究方向之一[31–33]。自第一代超级计算机诞生以来,大气模式一直是超级计算机的最为主要的用户之一,且需求随着超级计算机的发展不断演进[34]。在向量机时代,气候模式已经广泛被部署到了诸如Cary1,CrayX-MP以及日本地球模拟器(EarthSimulator)上[35]。上世纪90年代起,随着多核系统逐渐取代向量机成为超级计算机构建的主流,大气模式程序的构建开始以面向多核处理器为导向。诸如美国国家大气研究中心研发的社区地球系统模式(CommunityEarthSystemModel,CESM)[17],天气预报模式(WeatherResearchandForecastingModel,WRF)[19],日本Satoh等人开发的非静力二十面体大气模式(NonhydrostaticIscosahedralAtmosphericModel,NICAM)[36]等全球或区域模式均是其中优秀的代表。伴随着处理器内核数目的增加,基于MPI与OpenMP等并行方式的程序被引入到以上大气模式代码中,以充分利用硬件性能。图2.150年间德国气象服务中心超级计算机计算能力变迁[37]。9
第2章研究现状分析核心),在双精度下保持7.95Pflops的总体性能,并在488米水平分辨率下实现快速准确的大气模拟(超过770亿个未知量),模拟速度达到每天0.07个模拟年。据我们所知,这是迄今为止最大的完全隐式模拟。这项工作也获得了2016年ACM戈登贝尔奖。基于物理部分与动力框架部分的优化基础,近年来针对模式整体的异构优化工作已经有部分成果。2016年初,瑞士气象局异构超级计算机投入运营。该超级计算机由24个节点构成,每个节点中有2块IntelXeonCPU以及8块NvidiaTeslaK80GPU,节点间使用Infiniband网络高速互连。在超级计算机中,GPU部分提供了超过90%的计算能力。瑞士气象局的科研工作者将COSMO区域模式算法[44]在其上进行了部署,通过充分利用异构计算机的硬件架构以及针对架构做出的算法调优,以1.3倍的硬件计算能力完成了40倍的模拟速度需求,为其他国家气象机构提供了一个很好的范例。图2.2瑞士气象局通过软件调优与平台移植平衡计算能力与模式分辨率的需求[25]新一代COSMO模式算法[25]相比于上一代大气模式程序,主要的性能需求来自于数据同化、多模式集合、分辨率提升三个方面。在加速实现上,瑞士气象局对于大气模拟领域专家与计算机科学家进行了明确的分工,针对最新的硬件架构模型,大气领域专家针对物理模型的数学实现、算法描述以及代码实现进行了相应的调整,而计算机工程师将初始的代码实现部署到最新的硬件架构上并进行了卓有成效的调优工作。通过两方的紧密协作与沟通,圆满地完成了预期目标,并提炼出了基于新型架构的模式开发的几点注意事项:首先,软件算法应当尽可能地减少通讯与同步,尽量不要采用Fork-Join模式并尽可能避免算法中的通信操作。14
【参考文献】:
期刊论文
[1]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[2]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 杨学军,廖湘科,卢凯,胡庆丰,宋君强,苏金树. Journal of Computer Science & Technology. 2011(03)
本文编号:3382567
【文章来源】:清华大学北京市 211工程院校 985工程院校 教育部直属院校
【文章页数】:129 页
【学位级别】:博士
【部分图文】:
近25年来国际超级计算机计算能力发展状况及趋势(统计数据截止2018年11月,图片数据源于超级计算机性能排行榜(Top500)官方网站[3])
第2章研究现状分析第2章研究现状分析2.1基于同构超级计算机的大气方程并行优化气候变化所导致的全球变暖,极端天气频发等现象已成为制约人类生产生活,限制国民经济增长的重要问题。作为气候建模研究的关键组成部分之一,大气模拟在高性能计算中备受关注,研究更准确、更高效的大气模式以应对重大气候问题的挑战,一直以来是世界各国在科学计算领域所面对的最为重要的研究方向之一[31–33]。自第一代超级计算机诞生以来,大气模式一直是超级计算机的最为主要的用户之一,且需求随着超级计算机的发展不断演进[34]。在向量机时代,气候模式已经广泛被部署到了诸如Cary1,CrayX-MP以及日本地球模拟器(EarthSimulator)上[35]。上世纪90年代起,随着多核系统逐渐取代向量机成为超级计算机构建的主流,大气模式程序的构建开始以面向多核处理器为导向。诸如美国国家大气研究中心研发的社区地球系统模式(CommunityEarthSystemModel,CESM)[17],天气预报模式(WeatherResearchandForecastingModel,WRF)[19],日本Satoh等人开发的非静力二十面体大气模式(NonhydrostaticIscosahedralAtmosphericModel,NICAM)[36]等全球或区域模式均是其中优秀的代表。伴随着处理器内核数目的增加,基于MPI与OpenMP等并行方式的程序被引入到以上大气模式代码中,以充分利用硬件性能。图2.150年间德国气象服务中心超级计算机计算能力变迁[37]。9
第2章研究现状分析核心),在双精度下保持7.95Pflops的总体性能,并在488米水平分辨率下实现快速准确的大气模拟(超过770亿个未知量),模拟速度达到每天0.07个模拟年。据我们所知,这是迄今为止最大的完全隐式模拟。这项工作也获得了2016年ACM戈登贝尔奖。基于物理部分与动力框架部分的优化基础,近年来针对模式整体的异构优化工作已经有部分成果。2016年初,瑞士气象局异构超级计算机投入运营。该超级计算机由24个节点构成,每个节点中有2块IntelXeonCPU以及8块NvidiaTeslaK80GPU,节点间使用Infiniband网络高速互连。在超级计算机中,GPU部分提供了超过90%的计算能力。瑞士气象局的科研工作者将COSMO区域模式算法[44]在其上进行了部署,通过充分利用异构计算机的硬件架构以及针对架构做出的算法调优,以1.3倍的硬件计算能力完成了40倍的模拟速度需求,为其他国家气象机构提供了一个很好的范例。图2.2瑞士气象局通过软件调优与平台移植平衡计算能力与模式分辨率的需求[25]新一代COSMO模式算法[25]相比于上一代大气模式程序,主要的性能需求来自于数据同化、多模式集合、分辨率提升三个方面。在加速实现上,瑞士气象局对于大气模拟领域专家与计算机科学家进行了明确的分工,针对最新的硬件架构模型,大气领域专家针对物理模型的数学实现、算法描述以及代码实现进行了相应的调整,而计算机工程师将初始的代码实现部署到最新的硬件架构上并进行了卓有成效的调优工作。通过两方的紧密协作与沟通,圆满地完成了预期目标,并提炼出了基于新型架构的模式开发的几点注意事项:首先,软件算法应当尽可能地减少通讯与同步,尽量不要采用Fork-Join模式并尽可能避免算法中的通信操作。14
【参考文献】:
期刊论文
[1]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[2]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 杨学军,廖湘科,卢凯,胡庆丰,宋君强,苏金树. Journal of Computer Science & Technology. 2011(03)
本文编号:3382567
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3382567.html