当前位置:主页 > 科技论文 > 计算机论文 >

面向存储层次设计优化的GPU程序性能分析

发布时间:2018-05-19 10:58

  本文选题:异构系统 + 图形处理器 ; 参考:《计算机科学》2017年12期


【摘要】:图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。
[Abstract]:Graphics processor (GPU) has become one of the most popular accelerators for building heterogeneous parallel systems because of its higher peak performance and energy efficiency than traditional CPU and the increasingly mature software environment. Although GPU relies on the flexible switching of lightweight threads to hide the memory access delay, its high degree of concurrency still brings great pressure to the storage system, and its performance exerts a strong influence on the efficiency of the visited memory. Therefore, the analysis and optimization of memory access behavior of GPU programs has been a hot topic in GPU related fields, but there is little work to analyze the impact of storage hierarchy design on performance from the perspective of architecture. In order to better guide the design of GPU storage hierarchy and memory access optimization, the effects of GPU storage levels on program performance are analyzed in detail from the point of view of experiments, and some guiding optimization strategies are summarized. Provide suggestions for storage hierarchy design and program optimization of similar architectures in the future.
【作者单位】: 国防科学技术大学计算机学院;
【基金】:国家自然科学基金(61402488) 教育部博士点基金(20134307120035)资助
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 白振兴,何华灿,魏宝刚;智能IC卡的分类与标准及技术性能分析[J];现代电子技术;1997年02期

2 ;图形处理器加速移动产品设计[J];电子产品世界;2001年07期

3 ;NVIDIA GeForce FX被评为2002年最佳图形处理器[J];CAD/CAM与制造业信息化;2003年Z1期

4 李海燕;张春元;李礼;任巨;;图形处理器的流执行模型[J];计算机工程;2008年22期

5 肖灵芝;蒲林;韩俊刚;李涛;;异构多核图形处理器存储系统设计与实现[J];电子技术应用;2013年05期

6 吴亮;钟诚文;郑彦奎;刘沙;卓丛山;陈效鹏;;多图形处理器上Lattice-Boltzmann方法的加速[J];计算机辅助设计与图形学学报;2010年11期

7 钟联波;;GPU与CPU的比较分析[J];技术与市场;2009年09期

8 明月;图形精灵Paint Shop Pro for Wn95——介绍图形处理器Paint Shop Pro4.1[J];电脑;1998年02期

9 张健;陈瑞;;图形处理器在通用计算中的应用[J];计算机工程与设计;2009年14期

10 ;全新Mac Pro开始发售[J];影视制作;2014年01期

相关重要报纸文章 前10条

1 《网络世界》记者 蒙克;福禄克推出应用性能分析解决方案[N];网络世界;2013年

2 严威川;明明白白显卡“芯”[N];中国电脑教育报;2007年

3 ;NEC图形处理器每秒运行50.2G条指令[N];计算机世界;2003年

4 均儿;人人都有台超级计算机[N];电脑报;2008年

5 小邹;服务器进入异构并行时代[N];电脑报;2010年

6 赵欣;“玩”3D,笔记本也行![N];中国计算机报;2003年

7 ;HP Compaq Evo D210教育信息化的好帮手[N];中国计算机报;2003年

8 记者 郇公弟;显卡革命:或让最快CPU望尘莫及[N];新华每日电讯;2009年

9 乐天 编译;混合CPU更节能[N];计算机世界;2009年

10 本报记者 李奕;有多少企业需要HPC?[N];中国计算机报;2013年

相关博士学位论文 前5条

1 祖渊;基于图形处理器的高速并行算法研究[D];中国科学技术大学;2014年

2 柴俊;面向应用的加速器增强型异构系统大规模并行计算关键技术研究[D];国防科学技术大学;2014年

3 吴强;面向异构系统的并行编程关键技术研究[D];国防科学技术大学;2014年

4 刘军;动态异构虚拟盘阵及其关键技术研究[D];国防科学技术大学;2004年

5 冯权友;大规模众核微处理器互连网络体系结构及性能分析研究[D];国防科学技术大学;2012年

相关硕士学位论文 前10条

1 李豪;面向OpenFOAM并行开发框架的性能分析关键技术研究[D];国防科学技术大学;2013年

2 徐蔚;基于图形处理器的窗口系统的研究[D];西安工程大学;2015年

3 刘伍锋;基于PCI总线的主设备功能仿真与验证[D];西安电子科技大学;2016年

4 李天骥;图形处理器存储系统的高精度System Verilog模型与自动化仿真验证[D];西安电子科技大学;2016年

5 陈贵华;基于RDMA高性能通信库的设计与实现[D];华中科技大学;2015年

6 阙恒;嵌入式图形处理器设计[D];南京航空航天大学;2007年

7 周国建;龙芯嵌入式系统的性能分析与优化研究[D];中国石油大学;2008年

8 王皓;基于图形处理器的数据流并行处理方法研究[D];大连理工大学;2009年

9 兰王靖辉;一种针对异构多核平台的系统架构的研究与实现[D];电子科技大学;2014年

10 成思远;异构(CPU-GPU)计算机系统性能评测与优化技术研究[D];国防科学技术大学;2011年



本文编号:1909841

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1909841.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户26677***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com