基于CPU-GPU异构计算的负载能效优化的设计与实现
发布时间:2021-09-05 20:29
随着云计算、大数据、人工智能等技术的高速发展,CPU-GPU异构的高性能计算方式越来越多地被数据中心采用,这样的计算方式具有更高的并行度、计算峰值和灵活性,但是其能耗峰值也明显增加。在异构计算的环境下,当单个负载运行时,在满足性能需求的前提下,保持最高的GPU核心频率可能会造成大量的能耗浪费;当混合负载运行时,若混合负载对GPU资源形成竞争,则会导致性能损失。因此需要合理地调度负载,在不违反性能约束的情况下,提高整体效率,从而提升能效。针对上述问题,首先通过实际测量手段,在特定的硬件平台上运行14种代表性负载,找到单个负载运行的最佳频率;进而使用DVFS调整频率,获得负载的性能损失和能耗效果。通过实验分析,发现实际调度效果明显依赖于负载类型,但传统内存/计算密集二元分类法不适合此类异构平台。基于此,通过关键参数(例如内存停顿、GPU利用率、GPU带宽和负载执行时间等)对于实际测试结果的分类训练,从而把负载分为六类。与传统的负载分类效果相比,每个类别的负载在使用DVFS时呈现相似的性能和功耗特性,从而得到较为准确的性能能效模型。基于此模型,能够对于混合负载进行有效调度,从而提升混合负载的...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
CPU与GPU结构的区别CPU的指令执行过程采用流水线技术,先取指令,然后指令译码,最后是指令
并没有将 GPU 视为系统的一部分,所以他们的方法不能直接应用于 CPU-GPU 异构架构。Kai Ma 等人[19]提出了一种 GPU-CPU 异构系统,在几个标准测试集上达到了平均节能 21.04%的效果,取名为 GreenGPU。GreenGPU 的结构设计如图 1.2 所示。图 1.2 GreenGPU 内部结构设计图 1.2 的下半部分展示了典型的 GPU-CPU 异构平台逻辑结构。CPU、主存储器和 GPU 通过系统总线连接,其中 CPU 作为主设备工作,GPU 在这个系统中作为协同设备工作。虽然 GPU 是一个协处理器,但它可以直接访问 DMA,以提供内存容量。CPU 和 GPU 的架构非常不同,与 CPU 相比,GPU 有很多流处理器(SP),并且这些流处理器会组成流式多处理器(SM)
图 2.1 Nvidia Titan Xp GPU 架构性负载 中实验使用的负载均来自于 Rodinia 测试集[26][27]、Polybench GP9][30]和 CUDA SDK Samples[31],还有 Parboil 测试集[32]也是
【参考文献】:
期刊论文
[1]CPU-GPU异构多核系统的动态任务调度算法[J]. 裴颂文,宁静,张俊格. 计算机应用研究. 2016(11)
本文编号:3386036
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
CPU与GPU结构的区别CPU的指令执行过程采用流水线技术,先取指令,然后指令译码,最后是指令
并没有将 GPU 视为系统的一部分,所以他们的方法不能直接应用于 CPU-GPU 异构架构。Kai Ma 等人[19]提出了一种 GPU-CPU 异构系统,在几个标准测试集上达到了平均节能 21.04%的效果,取名为 GreenGPU。GreenGPU 的结构设计如图 1.2 所示。图 1.2 GreenGPU 内部结构设计图 1.2 的下半部分展示了典型的 GPU-CPU 异构平台逻辑结构。CPU、主存储器和 GPU 通过系统总线连接,其中 CPU 作为主设备工作,GPU 在这个系统中作为协同设备工作。虽然 GPU 是一个协处理器,但它可以直接访问 DMA,以提供内存容量。CPU 和 GPU 的架构非常不同,与 CPU 相比,GPU 有很多流处理器(SP),并且这些流处理器会组成流式多处理器(SM)
图 2.1 Nvidia Titan Xp GPU 架构性负载 中实验使用的负载均来自于 Rodinia 测试集[26][27]、Polybench GP9][30]和 CUDA SDK Samples[31],还有 Parboil 测试集[32]也是
【参考文献】:
期刊论文
[1]CPU-GPU异构多核系统的动态任务调度算法[J]. 裴颂文,宁静,张俊格. 计算机应用研究. 2016(11)
本文编号:3386036
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3386036.html