GPU平台上面向性能和功耗的分支优化

发布时间：2017-06-27 00:11

本文关键词：GPU平台上面向性能和功耗的分支优化，由笔耕文化传播整理发布。

【摘要】：强大的计算能力使得GPGPU在通用计算领域得到了广泛的应用。然而,GPGPU的SIMT(Single Instruction Multiple Threads)工作方式,使其执行效率受到应用中不一致分支行为(Branch Divergence)的严重影响。虽然人们提出了线程交换方法来减小分支带来的性能损失,但这种方法往往会引入额外的访存操作,不仅在一定程度上减少了线程交换优化的性能收益,还增加了功耗。首先举例说明线程交换范围对程序性能和功耗的影响;然后提出了一种减少线程交换所引入的额外访存操作的方法。实验表明,对于Reduction程序,当交换范围为256时,在性能平均损失为4%的情况下功耗降低幅度最大为7%;而对于Bitonic程序,当交换范围为256和512时,在没有功耗开销的情况下,性能分别最大提升了6.4%和5.3%。
【作者单位】：国防科学技术大学计算机学院;
【关键词】： 不一致分支行为 访存 线程交换
【基金】：国家自然科学基金项目(61472431,61202121) 教育部高等学校博士点新教师基金项目(20114307120013)资助
【分类号】：TP38
【正文快照】： 1　引言近几年,GPGPU在通用计算领域得到了广泛的应用,成为当前高性能计算系统的重要组成部分。许多应用被成功移植到CPU+GPU的异构平台上,得到了很好的加速效果。GPU的优势在于其强大的并行计算能力以及良好的可编程性。以NVIDIA公司的GPU产品为例,每个GPU中含有多个流多处理

本文关键词：GPU平台上面向性能和功耗的分支优化，由笔耕文化传播整理发布。

，

本文编号：488025

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/488025.html

上一篇：高职计算机文化基础微项目教学的设计与实施
下一篇：基于SkyEye虚拟机Android-ARM应用程序跨平台技术的研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|