高性能计算系统内存子系统的性能预测模型研究
发布时间:2020-05-22 07:45
【摘要】: 随着高性能计算技术在社会生产生活各方面的应用日益广泛,高性能计算的性能评测尤其是性能预测在高性能计算领域内逐渐受到重视。目前研究最广泛的是使用性能模型进行预测。建立性能模型,只需要收集关于应用程序及目标机器的一些相关信息进行分析,然后通过一些计算得出应用程序在目标机器上运行所需要的时间。相对于其他方法来说,整个预测过程花费的时间大大缩短,而且其预测精度也比较高。 现有的一些性能模型与程序所使用的数值算法密切相关,建立过程需要花费大量的专家人力,模型计算时间较长,无法实现自动化;另一些性能模型所使用的工具和建模方法基于某种类型的计算平台,且只对其少数战略同盟直接可用。 本文着重于高性能计算机系统的内存系统性能模型,分析了使用机器特征操作能力与应用程序中循环的内存访问模式相结合的性能模型框架,并在充分分析的基础上,对性能模型工具进行了移植,在Intel X86结构上实现了对应的模型计算工具,对应用程序中的循环而不是基本块进行处理,精简所需要考虑的内存访问特征;并针对该性能模型框架中为获取应用程序内存访问模式使用的Multi-MAPS测试工具可能存在的、不能覆盖所有的HPC应用程序中的内存访问模式的问题进行了讨论并提出了解决办法。 实验数据表明,使用移植到Intel X86结构上的性能模型进行性能预测能够达到预期的精度;通过插值的算法后可以使用已获取Multi-MAPS循环中的数据来计算其他应用程序中其他可能的内存访问模式所对应的机器内存带宽,从而可以加快整个性能模型计算的时间。
【图文】:
3.使用模拟器如simPlescalar[9〕进行模拟simplescalar工具集能为计算机系统性能及功耗分析、体系结构建模等提供了有效的支持。由于模拟是使实际应用程序在模拟的硬件环境下进行实际的运行,所以使用模拟的方法可以获得很精确的性能预测时间,而且通过修改模拟器的参数,可以对当时还没有生产出来的硬件进行性能预测。但是一般的科学计算程序运行时间较长,而使用模拟器对程序的每一条指令进行模拟执行则更会大大增加整个过程的时间(一般会产生10一100倍的时间延长)。尤其是精确到时钟周期的模拟,由于要模拟处理器的所有行为,整个模拟过程所花费的时间大约是实际应用程序执行时间的10“倍〔10〕。为了避免如此之大的延时,通常只使用时钟周期精度的模拟器模拟执行应用程序数分钟,然后根据在这段时间里获得的一些应用程序信息来进行性能预测。但是显然对于大多数的科学计算程序,其中某一部分的行为无法代表整个程序的行为,因此获得的预测精度不高。4.建立性能模型进行计算
存性能模型与通信系统性能模型中的系统特征文件和程序特性操作文件以获得该应用程序最终的运行时间预测。其中使用 MetasimConvolver对内存性能模型中的系统特征文件和程序特性操作的合成过程如表2一3和图2一7所示。对应于表2一3和图2一7所示的系统特征文件和程序特性操作进行合成可以用下面的计算公式来表示:执行时间=艺(Mem伽职/MemRate照)(公式2一2)i=1执行时间二艺{(、,伽BB,/、m,a,。。尽)+(、a,伽职/。。a,,a,。)}i=l(公式2一3)其中
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP302.1
【图文】:
3.使用模拟器如simPlescalar[9〕进行模拟simplescalar工具集能为计算机系统性能及功耗分析、体系结构建模等提供了有效的支持。由于模拟是使实际应用程序在模拟的硬件环境下进行实际的运行,所以使用模拟的方法可以获得很精确的性能预测时间,而且通过修改模拟器的参数,可以对当时还没有生产出来的硬件进行性能预测。但是一般的科学计算程序运行时间较长,而使用模拟器对程序的每一条指令进行模拟执行则更会大大增加整个过程的时间(一般会产生10一100倍的时间延长)。尤其是精确到时钟周期的模拟,由于要模拟处理器的所有行为,整个模拟过程所花费的时间大约是实际应用程序执行时间的10“倍〔10〕。为了避免如此之大的延时,通常只使用时钟周期精度的模拟器模拟执行应用程序数分钟,然后根据在这段时间里获得的一些应用程序信息来进行性能预测。但是显然对于大多数的科学计算程序,其中某一部分的行为无法代表整个程序的行为,因此获得的预测精度不高。4.建立性能模型进行计算
存性能模型与通信系统性能模型中的系统特征文件和程序特性操作文件以获得该应用程序最终的运行时间预测。其中使用 MetasimConvolver对内存性能模型中的系统特征文件和程序特性操作的合成过程如表2一3和图2一7所示。对应于表2一3和图2一7所示的系统特征文件和程序特性操作进行合成可以用下面的计算公式来表示:执行时间=艺(Mem伽职/MemRate照)(公式2一2)i=1执行时间二艺{(、,伽BB,/、m,a,。。尽)+(、a,伽职/。。a,,a,。)}i=l(公式2一3)其中
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP302.1
【相似文献】
相关期刊论文 前10条
1 黄翔;张文博;张波;魏峻;;基于方面模板的分布式组件系统性能预测方法[J];计算机科学;2009年08期
2 谢茗涛;高性能计算顶级会议在京 IBM论道“深度计算”[J];计算机与网络;2000年10期
3 陈晓鹏;中国高性能计算冲击新高标[J];中国计算机用户;2003年29期
4 ;高性能计算可服务于全民[J];中国教育网络;2009年12期
5 ;高性能发展重在应用 浪潮与中科院建立高性能战略合作[J];科技浪潮;2009年03期
6 ;曙光推动高性能计算走向普及[J];中国信息界;2005年16期
7 王r
本文编号:2675672
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2675672.html