当前位置:主页 > 科技论文 > 计算机论文 >

基于NUMA架构的多线程程序性能和能耗研究

发布时间:2020-03-21 18:43
【摘要】:在云计算环境下,非一致性内存访问NUMA(Non-Uniform Memory Access)架构运用的越来越广泛。当单线程多任务的程序运行在NUMA系统上时,会遇到数据本地性和共享资源冲突两个问题。而当多线程程序运行在NUMA系统上时,会使上述的两个问题变得更加复杂:1)多线程程序的共享数据会导致不同节点之间产生远端访问,破坏NUMA系统本地性;2)当多个线程同时读取同一个NUMA节点上的内存数据时,会竞争该节点上的共享资源,导致严重的缓存以及互联总线冲突。另外,多线程程序还会带来关键线程的问题。具有更多远端内存访问的线程成为系统中的关键线程,这些关键线程会影响整个程序的性能并增加程序运行期间的能量消耗。以往的研究主要关注提升NUMA系统的性能,很少考虑节省NUMA系统的能耗。围绕上述若干问题,针对“基于NUMA架构的多线程程序性能和能耗研究”课题,开展了以下四个方面的研究:针对NUMA系统中出现的内存访问延迟过高的现象,提供给程序员一个工具检测并分析NUMA系统中的性能瓶颈。通过分析系统中的延迟信息,该工具能做出三种判断:1)如果共享数据的访问延迟要高于私有数据的访问延迟,那么系统中的共享数据会导致较大数目的远端访问;2)如果系统中存在异常高的内存访问延迟,那么系统中很有可能发生共享资源冲突;3)如果各线程之间的远端内存访问数目差异较大,那么远端内存访问数目最多的线程会成为影响整个程序性能的关键线程。在检测并分析出这些性能瓶颈之后,采用简便和通用的NUMA系统优化技术能够提升多线程程序的性能。针对关键线程导致NUMA系统性能下降的现象,提出一种对称式调度机制来均衡多线程之间的远端内存访问数目。在NUMA环境中,程序数据对于某些线程来说是本地数据,对于其他线程来说则是远端数据。具有远端内存访问较多的线程会比其他线程运行地更慢,成为影响整个多线程程序性能的关键线程。通过对称式线程调度机制,将线程对称地匹配到所有的处理器节点上,可以平衡所有线程的远端内存访问次数,使每个线程具有相似的本地和远端数据访问数目。这样,所有的线程几乎会同时达到线程同步点,避免关键线程拖累性能的情况发生。针对多线程程序在NUMA系统上运行时性能和能耗的关系,提出一个性能提升和能耗增长的线性负相关性模型。在模型中分别考虑以下两种假设:实际加速比趋近于常量,以及实际加速比趋近于线性加速比。基于性能和能耗之间关系,可以指导NUMA系统进行动态调优:根据多线程程序性能可扩展性的好坏,增加/减少该程序所使用的节点数,可以在满足能耗预算/性能要求前提下提升性能或者节省能耗。进一步研究发现,影响性能和能耗之间关系的因素包括:远端内存访问开销、线程间同步开销和负载非均衡开销。其中,由关键和非关键线程完成时间不一致引起的同步开销是导致程序性能/能耗可扩展性变差的主要原因之一。针对NUMA系统上关键线程和非关键线程的完成时间不同,提出一种动态频率调整策略来降低整个系统的能耗。在NUMA系统中,关键线程需要访问更多的远端内存,运行时间比非关键线程更长。因此,程序的执行时间是由关键线程决定的。在不延长程序整体执行时间的前提下,通过降低非关键线程所在的CPU核心频率,使关键线程和非关键线程同时达到多线程程序的同步点,可以节省非关键线程的能量消耗。通过使用基于关键线程的预测机制,进而能够有效地实施动态频率调整策略,从而节省更多的能耗。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP332

【参考文献】

相关期刊论文 前10条

1 任彤;傅杰;靳国杰;;基于NUMA架构的解释器访存优化设计与实现[J];高技术通讯;2015年07期

2 廖彬;傅杰;靳国杰;王一光;王磊;章隆兵;王剑;;NUMA结构的高效实时稳定的垃圾回收算法[J];高技术通讯;2015年02期

3 顾坚;刘伟;;面向NUMA集群的代数多重网格算法优化[J];计算机科学;2014年06期

4 王睿伯;卢锡城;卢凯;王绍刚;;面向CC-NUMA体系结构的事务内存冲突规避方法[J];计算机学报;2011年04期

5 王跃清;黄烨;王翰虎;陈梅;;混合结构数据库中基于页迁移的存储分层算法[J];计算机应用;2010年11期

6 潘国腾;窦强;谢伦国;;基于目录的Cache一致性协议的可扩展性研究[J];计算机工程与科学;2008年06期

7 许立;罗军;卢凯;;具有节点亲近能力的NUMA调度算法[J];计算机工程;2006年01期

8 杨梦梦,卢凯,卢锡城;内存管理系统对NUMA的支持及优化[J];计算机工程;2005年16期

9 庞立会,陈渝;一种CC-NUMA系统模拟环境的研究与实现[J];计算机工程;2005年03期

10 陈渝,nudt.edu.cn,李春江,杨学军,陈福接;CC-NUMA并行系统通信优化的变换技术[J];软件学报;2000年04期



本文编号:2593769

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2593769.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户90cac***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com