高性能计算多层次不连续非线性可扩展现象研究
发布时间:2022-01-02 22:26
高性能计算是计算科学的具体实践,极大地促进了各领域的科学进展,也对国家的经济建设起到了无法替代的基础性作用.从几十年发展的时间尺度和十万至百万核量级并行规模尺度研究大规模并行软件的研制发展历史来看,发现大规模并行应用软件的开发中物理模型、并行算法、并行软件实现以及底层硬件多个层次中存在的可扩展性的两种有趣现象,即不连续性和非线性现象.本文总结分析这一普遍存在现象,系统梳理计算机软硬件发展,特别是高性能计算发展中的可扩展问题,为未来并行计算领域发展提供方法论层面的借鉴和指导.
【文章来源】:计算机学报. 2020,43(06)北大核心EICSCD
【文章页数】:17 页
【部分图文】:
多层次不连续非线性可扩展现象
但依赖单CPU主频提升性能的时代已经结束[29],这是硬件上的不连续现象之一.从90nm开始,由于漏电流的问题,登纳德扩展定律已逐渐失效,即若想随着晶体管尺寸缩小继续提升主频,每个晶体管的电压不能相应降低,则总功耗会随着晶体管数目指数增长,这在当前功耗预算和散热能力的要求下都是不可接受的.因此,借用在文献中经常出现的图2所示,处理器主频已经有十多年没有明显提升了.若想利用芯片上越来越多的晶体管提升程序性能,只能另辟蹊径———采用并行的架构,这给硬软件设计都带来了划时代的变革,从此进入并行时代.另一方面,存储墙及功耗墙等问题也成为制约单核处理器性能提升的瓶颈.这些因素导致芯片生产商转而通过增加处理器核数使得处理器晶体管数量继续沿摩尔定律增加,多核/众核架构成为计算机体系结构发展的重要趋势.其中,以GPU[30-33]为代表的众核架构以其更强的计算能力和更高的访存带宽受到了越来越多应用开发人员的青睐.自2007年NVIDIA首次提出GPGPU概念以来,GPU在通用计算领域得到了日益广泛地应用.主流GPU厂商也根据实际计算需求,对GPU架构进行了不断改进和完善[34].
当前大气环流模式的发展主要集中在两个方向,一方面是物理过程越来越精细,一方面是分辨率越来越高,因为更高分辨率的气候系统模式能直接分辨更精细时空尺度的物理过程,从而有更高的模式性能.如图3所示,精度和分辨率的提高可以对全球气候进行更为精细地模拟和分析,而精度和分辨率的提高导致了问题规模的扩大.依据计算内容和计算特点的不同,大气环流模式可以分为动力框架和物理过程两大部分.动力框架主要是用来求解关于时间的偏微分方程组,离散方案的设计是关键,要同时保证计算的稳定性、守恒性、精确性和高效性.动力框架的计算在空间上是三维的,每一点的计算都可能与周围的很多点有关系.物理过程主要用来计算控制方程中的源汇项,以及一些诊断量(如降水、云量、辐射通量等).物理过程的计算是在单柱(single column)上进行的,也就是说是一维的,仅有垂直方向的数据交换.
【参考文献】:
期刊论文
[1]并行计算系统度量指标综述[J]. 王之元,杨学军. 计算机工程与科学. 2010(10)
[2]基于前验负载差异的负载平衡性能模型[J]. 张理论,吴建平,宋君强. 计算机应用. 2009(10)
[3]数值并行计算可扩展性评价与测试[J]. 迟利华,刘杰,胡庆丰. 计算机研究与发展. 2005(06)
[4]近优可扩展性:一种实用的可扩展性度量[J]. 陈军,李晓梅. 计算机学报. 2001(02)
[5]一种更有效的并行系统可扩展性模型[J]. 王与力,杨晓东. 计算机学报. 2001(01)
本文编号:3564995
【文章来源】:计算机学报. 2020,43(06)北大核心EICSCD
【文章页数】:17 页
【部分图文】:
多层次不连续非线性可扩展现象
但依赖单CPU主频提升性能的时代已经结束[29],这是硬件上的不连续现象之一.从90nm开始,由于漏电流的问题,登纳德扩展定律已逐渐失效,即若想随着晶体管尺寸缩小继续提升主频,每个晶体管的电压不能相应降低,则总功耗会随着晶体管数目指数增长,这在当前功耗预算和散热能力的要求下都是不可接受的.因此,借用在文献中经常出现的图2所示,处理器主频已经有十多年没有明显提升了.若想利用芯片上越来越多的晶体管提升程序性能,只能另辟蹊径———采用并行的架构,这给硬软件设计都带来了划时代的变革,从此进入并行时代.另一方面,存储墙及功耗墙等问题也成为制约单核处理器性能提升的瓶颈.这些因素导致芯片生产商转而通过增加处理器核数使得处理器晶体管数量继续沿摩尔定律增加,多核/众核架构成为计算机体系结构发展的重要趋势.其中,以GPU[30-33]为代表的众核架构以其更强的计算能力和更高的访存带宽受到了越来越多应用开发人员的青睐.自2007年NVIDIA首次提出GPGPU概念以来,GPU在通用计算领域得到了日益广泛地应用.主流GPU厂商也根据实际计算需求,对GPU架构进行了不断改进和完善[34].
当前大气环流模式的发展主要集中在两个方向,一方面是物理过程越来越精细,一方面是分辨率越来越高,因为更高分辨率的气候系统模式能直接分辨更精细时空尺度的物理过程,从而有更高的模式性能.如图3所示,精度和分辨率的提高可以对全球气候进行更为精细地模拟和分析,而精度和分辨率的提高导致了问题规模的扩大.依据计算内容和计算特点的不同,大气环流模式可以分为动力框架和物理过程两大部分.动力框架主要是用来求解关于时间的偏微分方程组,离散方案的设计是关键,要同时保证计算的稳定性、守恒性、精确性和高效性.动力框架的计算在空间上是三维的,每一点的计算都可能与周围的很多点有关系.物理过程主要用来计算控制方程中的源汇项,以及一些诊断量(如降水、云量、辐射通量等).物理过程的计算是在单柱(single column)上进行的,也就是说是一维的,仅有垂直方向的数据交换.
【参考文献】:
期刊论文
[1]并行计算系统度量指标综述[J]. 王之元,杨学军. 计算机工程与科学. 2010(10)
[2]基于前验负载差异的负载平衡性能模型[J]. 张理论,吴建平,宋君强. 计算机应用. 2009(10)
[3]数值并行计算可扩展性评价与测试[J]. 迟利华,刘杰,胡庆丰. 计算机研究与发展. 2005(06)
[4]近优可扩展性:一种实用的可扩展性度量[J]. 陈军,李晓梅. 计算机学报. 2001(02)
[5]一种更有效的并行系统可扩展性模型[J]. 王与力,杨晓东. 计算机学报. 2001(01)
本文编号:3564995
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3564995.html