当前位置:主页 > 科技论文 > 计算机论文 >

CPU-GPU融合架构上共享Cache的动态划分技术

发布时间:2017-04-28 05:13

  本文关键词:CPU-GPU融合架构上共享Cache的动态划分技术,,由笔耕文化传播整理发布。


【摘要】:近年来,为了降低片内通信延迟和获得更高的资源利用率,学术界和工业界提出了将CPU和GPU"结合”在同一块芯片上的融合结构。这种CPU和GPU的融合架构大都采用多级缓存层次的结构,并共享末级高速缓存。由于上级高速缓存的局部性过滤作用,致使末级高速缓存的数据局部性较差。传统的LRU缓存替换策略难以有效利用末级高速缓存空间,严重影响程序的性能提升。因此,对末级高速缓存进行更高效地管理和优化,减少末级高速缓存的缺失率对于提高系统的整体性能有非常重要的意义。另外,CPU和GPU具有不同的体系结构,它们在末级高速缓存容量的敏感性上存在差异。GPU上有大量的执行线程,GPU应用程序的访存需求大,因此在LRU替换策略下,GPU程序占用大量的缓存空间,但是程序的性能并没有随着缓存容量的增加而明显提高:在这种情况下,CPU应用程序很难分配到足够的缓存,影响了系统的整体性能。上述两个问题给CPU和GPU间共享的末级缓存管理带来新的挑战。本文分析了GPU应用程序访存特征,借鉴CMP结构下缓存优化策略,提出对CPU-GPU融合架构共享的末级高速缓存进行基于I-M CP动态划分的方案,从而提高系统整体性能。本文的主要研究工作和成果包括以下两点:1.分别从线程切换代价、并行核心、存储带宽、缓存读取方式等方面分析了CPU和GPU架构的区别。在CPU和GPU上运行相应的基准测试程序,并从访存次数、局部性、带宽需求以及访存缺失率等四个方面分析CPU和GPU的访存特征的区别,提出了GPU应用程序缓存敏感性评价方法,并对GPU应用程序进行分类。2.结合末级高速缓存优化策略以及CPU和GPU应用程序的特征,提出了基于CPU-GPU融合架构的共享末级高速缓存I-M CP动态划分方法,对CPU-GPU融合系统的末级高速缓存进行基于I-M CP算法的动态划分。本文通过详细的实验设计,对CPU和GPU的访存特征和缓存划分进行多个维度的测试。实验结果表明,通过缓存划分可以有效避免CPU和GPU程序间的干扰。经过测试后发现,缓存划分方法使得程序整体性能得到了很大提升,说明本文提出的划分方法是十分有效的。与传统LRU策略相比,最优静态划分和I-MCP动态划分可以使系统整体性能分别提升11.62%和13.63%,而两种划分策略使得GPU程序的性能分别只下降了3.27%和0.87%。
【关键词】:GPU缓存敏感性 融合架构 共享末级高速缓存 动态缓存划分
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
  • 摘要5-6
  • ABSTRACT6-12
  • 第1章 绪论12-22
  • 1.1 研究背景13-19
  • 1.1.1 处理器的体系结构13-15
  • 1.1.2 CPU-GPU融合微处理器架构15-17
  • 1.1.3 末级高速缓存介绍17-19
  • 1.2 研究问题和研究意义19-20
  • 1.3 论文主要工作20-21
  • 1.4 论文组织结构21-22
  • 第2章 相关背景22-32
  • 2.1 CPU-GPU融合架构22-26
  • 2.1.1 AMD融合芯片发展史23
  • 2.1.2 Intel融合芯片发展史23-24
  • 2.1.3 Nvidia融合芯片发展史24-25
  • 2.1.4 CPU-GPU融合架构面对的挑战25-26
  • 2.2 末级高速缓存的组织和管理26-29
  • 2.2.1 末级高速缓存的组织26-27
  • 2.2.2 末级高速缓存的管理27-28
  • 2.2.3 末级高速缓存优化技术28-29
  • 2.3 末级高速缓存性能分析方法29-30
  • 2.4 本章小结30-32
  • 第3章 CPU和GPU访存行为分析32-44
  • 3.1 Gem5-GPU模拟器介绍32-34
  • 3.2 CPU和GPU访存行为分析34-41
  • 3.2.1 模拟器参数34-35
  • 3.2.2 基准测试程序35-36
  • 3.2.3 访存次数对比36
  • 3.2.4 局部性的对比36-37
  • 3.2.5 带宽需求对比37-38
  • 3.2.6 访存缺失对性能的影响38-39
  • 3.2.7 访存差异原因分析39-41
  • 3.3 GPU应用程序缓存敏感性分析41-43
  • 3.4 本章小结43-44
  • 第4章 CPU-GPU融合架构上共享Cache划分44-58
  • 4.1 末级高速缓存划分的重要性44-47
  • 4.1.1 高速缓存对通用GPU的重要性44-45
  • 4.1.2 末级高速缓存划分的重要性45-47
  • 4.2 CPU-GPU融合架构上共享Cache的动态划分方案47-55
  • 4.2.1 栈距离剖析47-48
  • 4.2.2 静态划分方案48-49
  • 4.2.3 CPU-GPU融合架构上的动态缓存划分49
  • 4.2.4 动态缓存划分结构支持49-50
  • 4.2.5 监控器MON50-52
  • 4.2.6 动态缓存划分算法52-53
  • 4.2.7 动态缓存划分的实现53-55
  • 4.3 本章小结55-58
  • 第5章 动态缓存划分实验评估58-66
  • 5.1 CPU-GPU融合处理器模型58-59
  • 5.2 基准测试程序集介绍59-60
  • 5.3 性能对比60-62
  • 5.4 多CPU程序对划分的影响62-63
  • 5.5 缓存容量对划分的影响63-64
  • 5.6 本章小结64-66
  • 第6章 全文总结66-70
  • 6.1 研究工作总结66-67
  • 6.2 本文创新点67-68
  • 6.3 未来工作展望68-70
  • 参考文献70-74
  • 致谢74-76
  • 在读期间发表的学术论文与取得的研究成果76

【相似文献】

中国期刊全文数据库 前10条

1 崔昌栋;鞠大鹏;李兆麟;;采用路选择技术实现的低功耗高速缓存设计[J];清华大学学报(自然科学版);2007年01期

2 陈黎明;邹雪城;雷擰铭;刘政林;;动态可重构高速缓存结构的研究与设计[J];微电子学;2007年06期

3 黄涛;王晶;管雪涛;钟祺;王克义;;一种降低末级高速缓存污染的软件控制插入策略[J];电子学报;2012年12期

4 孙丕恕,辛卫华;高速缓存386系统的实现[J];小型微型计算机系统;1989年09期

5 徐景村,何培斌;微机高速缓存系统组织与数据更新探讨[J];山东师大学报(自然科学版);1998年01期

6 周全营;计算机存储系统的高速缓存[J];郑州纺织工学院学报;1999年S1期

7 吴英杰,王晓东;理想高速缓存模型及其高效算法研究[J];福州大学学报(自然科学版);2004年04期

8 胡泽林;张云泉;;高速缓存优化的并行连接算法[J];计算机工程与设计;2009年20期

9 刘娟;共享外部超高速缓存的双处理机块的设计和实施[J];航空计算技术;1998年01期

10 ;iCache提速详解[J];每周电脑报;2000年12期

中国重要会议论文全文数据库 前1条

1 高欣;刘衡竹;张波涛;;高速缓存优化研究与设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

中国重要报纸全文数据库 前10条

1 飞思卡尔半导体公司汽车和标准产品部Johann Holzmann;利用高速缓存体系结构进行汽车引擎嵌入式控制[N];中国电子报;2005年

2 杨阿昭;ECDN 提高网络性能[N];中国计算机报;2002年

3 宋占川;Oracle服务器性能调整攻略[N];计算机世界;2003年

4 高明云;高速缓存技术实现更快内容传输[N];人民邮电;2003年

5 山枫;趋势科技利用高速缓存方案 企业防毒性能长5倍[N];中国计算机报;2002年

6 陈怡均 DigiTimes;IBM研发新DRAM电路[N];电子资讯时报;2007年

7 本报记者 武汉;来跟着我的节拍[N];网络世界;2003年

8 小溪综合编译;新一代视频游戏机上演三国大战[N];计算机世界;2006年

9 ;显卡术语释义[N];电脑报;2002年

10 山东财政学院 杨晓红;为电子商务站点加速[N];计算机世界;2000年

中国博士学位论文全文数据库 前2条

1 方磊;适用于多/众核系统的智能目录高速缓存[D];浙江大学;2014年

2 隋秀峰;高性能微处理器中自适应高速缓存管理策略研究[D];中国科学技术大学;2010年

中国硕士学位论文全文数据库 前10条

1 孙传伟;CPU-GPU融合架构上共享Cache的动态划分技术[D];中国科学技术大学;2015年

2 冷冰;基于路访问轨迹和路休眠的高速缓存低功耗研究[D];浙江大学;2012年

3 吴英杰;充分利用高速缓存的高效算法研究[D];福州大学;2004年

4 梁静;基于路预测访问的低功耗高速缓存设计研究[D];浙江大学;2012年

5 赵彩;基于混合纠错码的可容错性高速缓存研究[D];浙江大学;2015年

6 陈石坤;多核处理器中CACHE一致性协议研究和实现[D];国防科学技术大学;2005年

7 姜彩萍;互联网高速缓存系统构建和性能分析[D];吉林大学;2004年

8 李瑞东;高速缓存参数无关DNA短序列精确比对算法[D];哈尔滨工业大学;2013年

9 陈燕晖;页面分配器的研究与实现[D];国防科学技术大学;2006年

10 虞增辉;轻量级Web浏览器的协议、技术及其实现[D];浙江大学;2005年


  本文关键词:CPU-GPU融合架构上共享Cache的动态划分技术,由笔耕文化传播整理发布。



本文编号:332184

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/332184.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户662c5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com