多核处理器片上Cache访问行为分析与优化机制研究
发布时间:2021-09-02 00:23
多核处理器(Chip Multi-Processors,CMP)相比单核处理器具有功耗低、复杂度小、可扩展性好和性价比高等优势,已成为工业界和学术界的主流微处理器体系结构。近来在服务器和数据中心等领域,服务聚合(Server Consolidation)和虚拟计算(Virtual Computing)成为趋势,使多样化的多道程序负载成为CMP平台上的主要负载形式。多核处理器多采用相对简单的处理器核,设计复杂性和性能瓶颈主要集中在存储系统上。随着半导体制造工艺进入纳米时代,多核处理器平台上的层次Cache系统面临着片外访问延迟大、片外访问带宽有限、负载多样化、片上互连线延迟不断增长和应用间负面相互干扰等挑战。片上层次Cache系统特别是非一级Cache(Non-First Level Cache)已成为当前多核处理器平台上的重要课题之一。Cache系统的有效性和多核处理器的系统性能与Cache上承受的Cache访问行为密切相关。分析Cache系统上的Cache访问行为特性对于研究多核处理器Cache系统的优化、管理机制有重要意义。本文针对多核处理器中片上非一级Cache的访问行为分析方法...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:160 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景
1.1.1 多核处理器成为主流
1.1.2 应用聚合的趋势
1.1.3 存储墙仍是问题
1.2 课题研究内容
1.2.1 片上非一级Cache 访问行为分析方法
1.2.2 片上非一级Cache 优化机制
1.3 论文主要工作及创新
1.4 论文结构
第二章 多核处理器片上非一级Cache 优化机制概述
2.1 Cache 基本概念
2.1.1 CPI 计算公式
2.1.2 Cache 替换与放置
2.1.3 LRU 栈与栈距离直方图SDH
2.2 多核处理器片上非一级Cache 组织方式
2.2.1 多核处理器片上非一级Cache 组织方式分类
2.2.2 片上Cache 空间共享对多核处理器系统性能的影响
2.2.3 非一致Cache 结构
2.3 多核处理器片上非一级共享Cache 优化
2.3.1 Cache 划分机制
2.3.2 Cache 替换策略
2.3.3 分布式共享Cache 优化
2.4 多核处理器片上非一级私有Cache 优化
2.5 多核处理器片上非一级混合Cache 组织方式优化
2.6 小结
第三章 多核处理器片上Cache 访问行为分析方法
3.1 CMP 在线应用Cache 行为识别方法OABI
3.1.1 相关研究
3.1.2 理论分析
3.1.3 应用Cache 行为类型
3.1.4 在线应用Cache 行为类型识别
3.1.5 SPEC CPU2006 基准测试程序Cache 行为类型识别
3.1.6 硬件开销
3.2 Cache 组访问压力测量方法
3.3 实验方法
3.3.1 实验配置
3.3.2 实验负载
3.3.3 评价指标
3.4 小结
第四章 应用行为感知的CMP 共享LLC 替换策略BIIP
4.1 引言
4.2 BIIP 机制
4.2.1 基本思想与总体结构
4.2.2 BIIP 策略族
4.3 实验结果与分析
4.3.1 系统性能实验结果
4.3.2 失效率实验结果
4.3.3 参数敏感性
4.3.4 Cache 配置敏感性
4.3.5 BIIP 随系统规模的扩展性
4.3.6 多线程负载下的性能
4.4 硬件开销
4.5 小结
第五章 应用行为感知的CMP 私有LLC 优化机制BICS
5.1 引言
5.2 BICS 机制
5.2.1 总体结构
5.2.2 基本思想
5.2.3 溢出决定算法
5.2.4 溢出实现
5.3 实验结果与分析
5.3.1 系统性能实验结果
5.3.2 存储访问分析
5.3.3 Cache 配置敏感性
5.3.4 BICS 随系统规模的扩展性
5.3.5 与DSR 比较
5.3.6 多线程负载下的性能
5.4 BICS 参数敏感性分析
5.4.1 BICS 对RSTR 的敏感性
5.4.2 BICS 对m 的敏感性
5.4.3 BICS 对k 的敏感性
5.4.4 BICS 对Thr_(LW) 和Th_(rI) 的敏感性
5.5 硬件开销
5.6 小结
第六章 Cache 组访问压力感知的CMP 私有LLC 优化机制BP-NUCA
6.1 BP-NUCA 机制
6.1.1 总体结构
6.1.2 基本思想
6.1.3 迁移实现机制
6.1.4 讨论
6.2 实验结果与分析
6.2.1 系统性能实验结果
6.2.2 存储访问分析
6.2.3 参数敏感性分析
6.2.4 Cache 配置敏感性
6.2.5 BP-NUCA 随系统规模的扩展性
6.2.6 与DSR 比较
6.2.7 BICS 与BP-NUCA 的比较
6.2.8 多线程负载下的性能
6.3 硬件开销
6.4 小结
第七章 非均匀组间访问分布对CMP 系统性能的影响
7.1 非均匀组间访问分布
7.2 相关研究
7.3 单核上的分布优化机制
7.3.1 SBC 优化机制
7.3.2 SBC 机制评估
7.4 CMP 上的分布优化机制
7.4.1 集中共享Cache
7.4.2 私有Cache
7.5 实验结果与发现
7.5.1 共享Cache 的实验结果
7.5.2 私有Cache 组织方式的实验结果
7.6 小结
第八章 结束语
8.1 工作总结
8.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
附录A 缩略表
本文编号:3377935
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:160 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景
1.1.1 多核处理器成为主流
1.1.2 应用聚合的趋势
1.1.3 存储墙仍是问题
1.2 课题研究内容
1.2.1 片上非一级Cache 访问行为分析方法
1.2.2 片上非一级Cache 优化机制
1.3 论文主要工作及创新
1.4 论文结构
第二章 多核处理器片上非一级Cache 优化机制概述
2.1 Cache 基本概念
2.1.1 CPI 计算公式
2.1.2 Cache 替换与放置
2.1.3 LRU 栈与栈距离直方图SDH
2.2 多核处理器片上非一级Cache 组织方式
2.2.1 多核处理器片上非一级Cache 组织方式分类
2.2.2 片上Cache 空间共享对多核处理器系统性能的影响
2.2.3 非一致Cache 结构
2.3 多核处理器片上非一级共享Cache 优化
2.3.1 Cache 划分机制
2.3.2 Cache 替换策略
2.3.3 分布式共享Cache 优化
2.4 多核处理器片上非一级私有Cache 优化
2.5 多核处理器片上非一级混合Cache 组织方式优化
2.6 小结
第三章 多核处理器片上Cache 访问行为分析方法
3.1 CMP 在线应用Cache 行为识别方法OABI
3.1.1 相关研究
3.1.2 理论分析
3.1.3 应用Cache 行为类型
3.1.4 在线应用Cache 行为类型识别
3.1.5 SPEC CPU2006 基准测试程序Cache 行为类型识别
3.1.6 硬件开销
3.2 Cache 组访问压力测量方法
3.3 实验方法
3.3.1 实验配置
3.3.2 实验负载
3.3.3 评价指标
3.4 小结
第四章 应用行为感知的CMP 共享LLC 替换策略BIIP
4.1 引言
4.2 BIIP 机制
4.2.1 基本思想与总体结构
4.2.2 BIIP 策略族
4.3 实验结果与分析
4.3.1 系统性能实验结果
4.3.2 失效率实验结果
4.3.3 参数敏感性
4.3.4 Cache 配置敏感性
4.3.5 BIIP 随系统规模的扩展性
4.3.6 多线程负载下的性能
4.4 硬件开销
4.5 小结
第五章 应用行为感知的CMP 私有LLC 优化机制BICS
5.1 引言
5.2 BICS 机制
5.2.1 总体结构
5.2.2 基本思想
5.2.3 溢出决定算法
5.2.4 溢出实现
5.3 实验结果与分析
5.3.1 系统性能实验结果
5.3.2 存储访问分析
5.3.3 Cache 配置敏感性
5.3.4 BICS 随系统规模的扩展性
5.3.5 与DSR 比较
5.3.6 多线程负载下的性能
5.4 BICS 参数敏感性分析
5.4.1 BICS 对RSTR 的敏感性
5.4.2 BICS 对m 的敏感性
5.4.3 BICS 对k 的敏感性
5.4.4 BICS 对Thr_(LW) 和Th_(rI) 的敏感性
5.5 硬件开销
5.6 小结
第六章 Cache 组访问压力感知的CMP 私有LLC 优化机制BP-NUCA
6.1 BP-NUCA 机制
6.1.1 总体结构
6.1.2 基本思想
6.1.3 迁移实现机制
6.1.4 讨论
6.2 实验结果与分析
6.2.1 系统性能实验结果
6.2.2 存储访问分析
6.2.3 参数敏感性分析
6.2.4 Cache 配置敏感性
6.2.5 BP-NUCA 随系统规模的扩展性
6.2.6 与DSR 比较
6.2.7 BICS 与BP-NUCA 的比较
6.2.8 多线程负载下的性能
6.3 硬件开销
6.4 小结
第七章 非均匀组间访问分布对CMP 系统性能的影响
7.1 非均匀组间访问分布
7.2 相关研究
7.3 单核上的分布优化机制
7.3.1 SBC 优化机制
7.3.2 SBC 机制评估
7.4 CMP 上的分布优化机制
7.4.1 集中共享Cache
7.4.2 私有Cache
7.5 实验结果与发现
7.5.1 共享Cache 的实验结果
7.5.2 私有Cache 组织方式的实验结果
7.6 小结
第八章 结束语
8.1 工作总结
8.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
附录A 缩略表
本文编号:3377935
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3377935.html