面向异构融合处理器的性能分析、优化及应用综述
发布时间:2021-09-02 03:35
随着异构计算技术的不断进步,CPU和GPU等设备相集成的异构融合处理器在近些年得到了充分的发展,并引起了学术界和工业界的关注.将多种设备进行集成带来了许多好处,例如,多种设备可以访问同样的内存,可以进行细粒度的交互.然而,这也带来了系统编程和优化方面的巨大挑战.充分发挥异构融合处理器的性能,需要充分利用集成体系结构中共享内存等特性;同时,还需结合具体应用特征对异构融合处理器上的不同设备进行优化.首先对目前涉及异构融合处理器的研究工作进行了分析,之后介绍了异构融合处理器的性能分析工作,并进一步介绍了相关优化技术,随后对异构融合处理器的应用进行了总结.最后,对异构融合处理器未来的研究方向进行展望,并进行了总结.
【文章来源】:软件学报. 2020,31(08)北大核心EICSCD
【文章页数】:22 页
【部分图文】:
并行度和循环优化[11]
尽管异构融合处理器的设计具有诸多挑战,目前仍出现了一些异构融合架构,如AMD公司的Carrizo[17]、Intel公司的Skylake[18]和Nvidia公司的Denver[19]等.图1以CPU、GPU相集成的异构融合处理器为例进行了展示,图1中的异构融合处理器分为CPU部分和GPU部分,这两部分可访问同样的内存.CPU部分具有L1和L2等多级缓存结构,不同型号的CPU略有不同.例如,AMD公司生产的A10-7850K异构融合处理器的CPU部分具有共享的L2缓存,而Intel公司生产的i7-4770R异构融合处理器则采用私有L2缓存设计.对于GPU部分不同硬件厂商生产的GPU存在较大的体系结构差异,包括局部存储和缓存设计等方面.例如,相比于A10-7850K异构融合处理器,i7-4770R异构融合处理器上存在共享L3缓存.此外,部分异构融合处理器上出现了多设备共享缓存和嵌入式存储(embedded DRAM,简称EDRAM)等结构.对于共享内存访问,目前对CPU和GPU等设备提供的带宽不一样[20].目前,针对异构融合处理器的研究工作都是围绕上述类型体系结构展开的.研究者围绕多设备相集成的特点结合应用在异构融合处理器上,进行各种性能分析与优化.由于异构融合处理器将不同设备集成在一起共享内存,和离散架构相比需要考虑更多因素,如多设备间如何保证内存一致性等问题.异构融合处理器共享内存的特性避免了通过PCIe的数据传输,但也增加了不同设备维护共享内存一致性的开销[21].
图2描述了表1中各方向的论文分布情况:性能分析类论文有16篇;性能优化类论文有14篇,主要集中在不同设备间的负载划分与调度优化;涉及具体应用实例的论文有23篇.目前,基于异构融合处理器的应用多集中在数据科学领域和科学计算领域,但随着近年来机器学习技术的发展,研究者开始考虑如何将异构融合处理器应用于机器学习领域,如深层神经网络训练的加速等环节.虽然目前这个领域的研究较少,但具有较大的发展潜力.此外,也有研究者提出了利用异构融合处理器对网络数据包进行处理的解决方案,这也是一个异构融合处理器潜在的应用方向.图3描述了各研究方向的论文随时间线的增长图.从图中可以看出,关于异构融合处理器的研究从2010年开始快速增加,这与计算机技术的发展密切相关.正是在2010年前后,AMD宣布推出集成CPU和GPU的异构融合处理器,以此为契机,关于融合处理器的研究开始被大量研究者作为研究课题.到目前为止,关于异构融合处理器的性能分析优化和基于异构融合处理器的应用是这个领域的热点方向.
【参考文献】:
博士论文
[1]面向集成异构平台的负载分析与优化关键技术研究[D]. 张峰.清华大学 2017
本文编号:3378226
【文章来源】:软件学报. 2020,31(08)北大核心EICSCD
【文章页数】:22 页
【部分图文】:
并行度和循环优化[11]
尽管异构融合处理器的设计具有诸多挑战,目前仍出现了一些异构融合架构,如AMD公司的Carrizo[17]、Intel公司的Skylake[18]和Nvidia公司的Denver[19]等.图1以CPU、GPU相集成的异构融合处理器为例进行了展示,图1中的异构融合处理器分为CPU部分和GPU部分,这两部分可访问同样的内存.CPU部分具有L1和L2等多级缓存结构,不同型号的CPU略有不同.例如,AMD公司生产的A10-7850K异构融合处理器的CPU部分具有共享的L2缓存,而Intel公司生产的i7-4770R异构融合处理器则采用私有L2缓存设计.对于GPU部分不同硬件厂商生产的GPU存在较大的体系结构差异,包括局部存储和缓存设计等方面.例如,相比于A10-7850K异构融合处理器,i7-4770R异构融合处理器上存在共享L3缓存.此外,部分异构融合处理器上出现了多设备共享缓存和嵌入式存储(embedded DRAM,简称EDRAM)等结构.对于共享内存访问,目前对CPU和GPU等设备提供的带宽不一样[20].目前,针对异构融合处理器的研究工作都是围绕上述类型体系结构展开的.研究者围绕多设备相集成的特点结合应用在异构融合处理器上,进行各种性能分析与优化.由于异构融合处理器将不同设备集成在一起共享内存,和离散架构相比需要考虑更多因素,如多设备间如何保证内存一致性等问题.异构融合处理器共享内存的特性避免了通过PCIe的数据传输,但也增加了不同设备维护共享内存一致性的开销[21].
图2描述了表1中各方向的论文分布情况:性能分析类论文有16篇;性能优化类论文有14篇,主要集中在不同设备间的负载划分与调度优化;涉及具体应用实例的论文有23篇.目前,基于异构融合处理器的应用多集中在数据科学领域和科学计算领域,但随着近年来机器学习技术的发展,研究者开始考虑如何将异构融合处理器应用于机器学习领域,如深层神经网络训练的加速等环节.虽然目前这个领域的研究较少,但具有较大的发展潜力.此外,也有研究者提出了利用异构融合处理器对网络数据包进行处理的解决方案,这也是一个异构融合处理器潜在的应用方向.图3描述了各研究方向的论文随时间线的增长图.从图中可以看出,关于异构融合处理器的研究从2010年开始快速增加,这与计算机技术的发展密切相关.正是在2010年前后,AMD宣布推出集成CPU和GPU的异构融合处理器,以此为契机,关于融合处理器的研究开始被大量研究者作为研究课题.到目前为止,关于异构融合处理器的性能分析优化和基于异构融合处理器的应用是这个领域的热点方向.
【参考文献】:
博士论文
[1]面向集成异构平台的负载分析与优化关键技术研究[D]. 张峰.清华大学 2017
本文编号:3378226
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3378226.html