基于重用距离的GPU缓存缺失分析模型的设计与验证
发布时间:2017-04-09 16:19
本文关键词:基于重用距离的GPU缓存缺失分析模型的设计与验证,,由笔耕文化传播整理发布。
【摘要】:近十年来,GPU从专用图形处理器逐渐发展成通用计算平台,凭借其强大的并行计算能力和功耗控制能力,GPU通用计算在科学计算领域得到了广泛的应用和关注。由于GPU芯片将大部分面积都分配给计算单元,仅分配少量芯片面积给缓存和控制单元,大量GPU应用程序的性能受限于GPU的访存速度,而非计算能力。对于GPU访存限制型应用程序,缓存使用效率对程序整体性能影响显著,优化缓存使用效率以提高整体性能是一种重要的手段。为了帮助程序开发者理解GPU缓存行为特征,选择恰当的缓存优化方法,准确性高、速度快、功能全的GPU缓存缺失分析工具就显得的尤为重要。本文根据GPU并行计算平台的特点,优化了重用距离算法在GPU平台的精度和速度,并设计了基于重用距离的GPU缓存缺失分析模型。具体地,根据GPU缓存微结构特征,修正重用距离算法中核心数据的更新时间,修正线程阻塞信息的使用机制,提升了GPU平台下重用距离算法精度。然后,根据GPU线程维度设置,将重用距离计算划分为多个子任务并行完成;合并访存记录以节省存储空间;根据访存总数量改变访存序列采样标准;提升GPU平台下重用距离算法速度。最后,基于重用距离理论,建立GPU缓存缺失分析模型,分析GPU应用程序的缓存行为特征。除了实现传统的缓存缺失类型分析,还提出缓存容量敏感性分析,预测在缓存容量发生变化时,缺失率将如何改变;以及,指令级缓存缺失分析,将GPU程序的缓存缺失定位到具体的访存指令。经过在PolyBench/GPU和Parboil两个GPU测试集上的验证实验,优化后,本文设计的GPU平台重用距离算法的平均误差由13.6%降至5.74%,重用距离计算的平均时间开销由7749ms降低到1297ms。此外,为了检验模型的实用性,将其运用于具体的GPU应用程序缓存缺失行为特征的分析中,并根据模型的分析结果,针对性地设计缓存性能优化方案,根据实验结果,优化后各GPU应用程序缓存缺失率和执行时间均明显下降,验证了本文设计的GPU缓存缺失分析模型的实用性。
【关键词】:GPU 缓存 重用距离 缺失分析
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP332
【目录】:
- 摘要5-6
- Abstract6-10
- 专用术语注释表10-11
- 第一章 绪论11-17
- 1.1 研究背景与意义11-13
- 1.2 国内外研究现状13-14
- 1.3 论文的研究目标和主要工作14-15
- 1.4 论文组织结构15-17
- 第二章 GPU缓存效率优化与缓存缺失分析17-27
- 2.1 缓存的硬件结构17-20
- 2.1.1 缓存的基础知识17-18
- 2.1.2 GPU体系结构中的缓存18-19
- 2.1.3 不同GPU微架构下的缓存微结构比较19-20
- 2.2 GPU缓存效率的软件优化20-22
- 2.2.1 GPU应用程序缓存效率低下的常见原因20-21
- 2.2.2 GPU缓存效率的软件优化方法21
- 2.2.3 GPU缓存缺失行为分析的重要性21-22
- 2.3 基于重用距离的缓存缺失分析22-25
- 2.3.1 经典的重用距离算法22-23
- 2.3.2 基于经典重用距离算法的缓存缺失分析23-24
- 2.3.3 GPU平台重用距离算法与缓存缺失分析的难点24-25
- 2.4 本章小结25-27
- 第三章 GPU平台重用距离算法优化27-39
- 3.1 Nugteren等人提出的GPU平台重用距离算法27-31
- 3.1.1 线程分组27-28
- 3.1.2 访存合并28-29
- 3.1.3 访存排序29-30
- 3.1.4 重用距离计算30-31
- 3.2 GPU平台重用距离算法的精度优化31-34
- 3.2.1 根据缓存行分配策略修正核心数据更新时间32-33
- 3.2.2 线程阻塞条件修正33-34
- 3.3 GPU平台重用距离算法的速度优化34-37
- 3.3.1 重用距离计算并行化34-35
- 3.3.2 访存序列采样与存储优化35-37
- 3.4 本章小结37-39
- 第四章 GPU缓存缺失分析模型的设计39-47
- 4.1 缓存模型的整体框架39-40
- 4.2 访存序列生成模块的设计40-42
- 4.2.1 序列生成器的设计41
- 4.2.2 访存序列生成模块的编译系统41-42
- 4.3 重用距离计算模块设计42
- 4.3.1 架构普适性设计42
- 4.4 缓存行为分析模块设计42-45
- 4.4.1 缓存缺失类型分析43-44
- 4.4.2 程序缓存容量敏感性分析44
- 4.4.3 指令级缓存缺失分析44-45
- 4.5 本章小结45-47
- 第五章 GPU缓存缺失分析模型的实验验证47-61
- 5.1 实验环境47-48
- 5.2 测试程序集的选择48-51
- 5.2.1 运算访存比评测49-50
- 5.2.2 内存印迹评测50-51
- 5.2.3 缓存缺失率评测51
- 5.3 GPU缓存缺失分析模型的精度验证51-54
- 5.3.1 实验设计51-52
- 5.3.2 实验结果与分析52-54
- 5.4 重用距离计算速度验证54-57
- 5.4.1 实验设计54-55
- 5.4.2 实验结果与分析55-57
- 5.5 GPU缓存分析模型的架构普适性验证57-59
- 5.5.1 实验设计57
- 5.5.2 实验结果与分析57-59
- 5.6 本章小结59-61
- 第六章 案例分析61-67
- 6.1 使用GPU缓存缺失分析模型的流程61-62
- 6.2 bfs:强制型缺失严重程序的分析与优化62-63
- 6.3 gesummv:缓存容量敏感型程序的分析与优化63-64
- 6.4 atax:指令级缺失显著程序的分析与优化64-66
- 6.5 本章小结66-67
- 第七章 总结与展望67-69
- 7.1 总结67
- 7.2 展望67-69
- 致谢69-71
- 参考文献71-73
【相似文献】
中国期刊全文数据库 前2条
1 王曦;;网络环境下高职图书馆服务体系缺失分析[J];内江科技;2013年12期
2 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 彭园园;孟岩;姚凤霞;韩娟娟;黄尚志;;中国人DMD基因缺失检测多重PCR新体系的建立[A];第八次全国医学遗传学学术会议(中华医学会2009年医学遗传学年会)论文摘要汇编[C];2009年
中国硕士学位论文全文数据库 前1条
1 张亚;基于重用距离的GPU缓存缺失分析模型的设计与验证[D];东南大学;2016年
本文关键词:基于重用距离的GPU缓存缺失分析模型的设计与验证,由笔耕文化传播整理发布。
本文编号:295653
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/295653.html