一种软硬结合的预取技术研究
发布时间:2021-04-28 09:45
“存储墙”问题一直是影响计算机效能的挑战性问题。随着技术的发展,处理器和存储器的速度差异不断的增大,同时多核技术使得存储瓶颈更加严重。针对Cache失效中的强制性失效和容量失效,传统的硬件预取或软件预取都不能很好的改善性能,因为硬件预取只是基于程序的历史信息来预测程序未来的行为,导致了预取过于盲目;而软件预取需要增加大量额外的预取指令,造成了预取性能不佳。软硬件结合的预取技术可以很好的结合软件预取和硬件预取的优点,但仍处于研究阶段。本文对软硬件结合的数据预取技术展开了深入研究,提出了编译指导的基于访存预取表的预取技术。为了更好地利用编译信息来指导预取,本文提出了一套可视化的Cache访问特性分析方法来研究Cache的行为规律。使用该方法对实验数据分析表明:对大数组线性访问是造成Cache失效的一个关键因素。为了提高Cache性能,文中采用了增量式的研究思路,提出了基于预取触发地址的访存预测表预取技术,将编译时的访存模式信息编码到访存指令中来指导预取的进行。该技术有效避免了传统顺序预取方法预取效率低的问题,可以有效的降低Cache失效率。同时,提出了将Evict Me和编译指导的访存预测...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景
1.2 研究现状
1.3 本文工作
1.4 论文结构
第二章 相关研究工作
2.1 基本概念
2.1.1 局部性原理
2.1.2 层次存储结构的基本概念
2.1.3 访存模式
2.2 相关工作
2.2.1 预取技术
2.2.2 软件管理的Cache技术
2.2.3 编译器优化技术
2.3 小结
第三章 对 Cache失效问题的研究
3.1 现状及意义
3.2 NPB的Cache行为分析
3.2.1 可视化的分析方法
3.2.2 分析与统计
3.3 小结
第四章 软硬件结合的预取技术研究
4.1 编译指导的失效时预取
4.1.1 基本思想
4.1.2 编译指导的失效时预取
4.1.3 设置预取标志位的编译算法框架
4.2 编译指导的基于访存预测表的预取技术
4.2.1 基本思想
4.2.2 对RPT技术的改进
4.2.3 编译指导的RPT技术
4.2.4 设置预取标志位的编译算法框架
4.3 编译指导的基于访存预测表的预取+编译指导的替换策略
4.3.1 基本思想
4.3.2 实现
4.3.3 设置替换标志位的编译算法框架
4.4 小结
第五章 性能评测
5.1 测试环境
5.1.1 模拟器
5.1.2 Benchmark
5.2 测试方案
5.3 实验结果分析
5.3.1 编译指导的失效时预取技术性能分析
5.3.2 编译指导的基于访存预测表的预取技术性能分析
5.3.3 编译指导替换策略和预取的基于访存预测表的预取技术性能分析
5.4 小结
第六章 结束语
6.1 主要工作
6.2 未来展望
致谢
参考文献
攻读硕士学位期间取得的学术成果
攻读硕士学位期间参加的科研工作
【参考文献】:
期刊论文
[1]一个由编译器控制的Cache替换策略[J]. 杜红燕,田兴彦,田新华. 计算机工程. 2006(08)
[2]一种新颖的软件可控Cache优化方法[J]. 杜红燕,田兴彦,田新华. 计算机工程与应用. 2005(21)
本文编号:3165259
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景
1.2 研究现状
1.3 本文工作
1.4 论文结构
第二章 相关研究工作
2.1 基本概念
2.1.1 局部性原理
2.1.2 层次存储结构的基本概念
2.1.3 访存模式
2.2 相关工作
2.2.1 预取技术
2.2.2 软件管理的Cache技术
2.2.3 编译器优化技术
2.3 小结
第三章 对 Cache失效问题的研究
3.1 现状及意义
3.2 NPB的Cache行为分析
3.2.1 可视化的分析方法
3.2.2 分析与统计
3.3 小结
第四章 软硬件结合的预取技术研究
4.1 编译指导的失效时预取
4.1.1 基本思想
4.1.2 编译指导的失效时预取
4.1.3 设置预取标志位的编译算法框架
4.2 编译指导的基于访存预测表的预取技术
4.2.1 基本思想
4.2.2 对RPT技术的改进
4.2.3 编译指导的RPT技术
4.2.4 设置预取标志位的编译算法框架
4.3 编译指导的基于访存预测表的预取+编译指导的替换策略
4.3.1 基本思想
4.3.2 实现
4.3.3 设置替换标志位的编译算法框架
4.4 小结
第五章 性能评测
5.1 测试环境
5.1.1 模拟器
5.1.2 Benchmark
5.2 测试方案
5.3 实验结果分析
5.3.1 编译指导的失效时预取技术性能分析
5.3.2 编译指导的基于访存预测表的预取技术性能分析
5.3.3 编译指导替换策略和预取的基于访存预测表的预取技术性能分析
5.4 小结
第六章 结束语
6.1 主要工作
6.2 未来展望
致谢
参考文献
攻读硕士学位期间取得的学术成果
攻读硕士学位期间参加的科研工作
【参考文献】:
期刊论文
[1]一个由编译器控制的Cache替换策略[J]. 杜红燕,田兴彦,田新华. 计算机工程. 2006(08)
[2]一种新颖的软件可控Cache优化方法[J]. 杜红燕,田兴彦,田新华. 计算机工程与应用. 2005(21)
本文编号:3165259
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3165259.html