共享高速缓存多核处理器的关键技术研究
发布时间:2021-10-17 17:11
以VLSI为代表的现代半导体工艺技术单方面的进步已经很难满足微处理器性能发展的需求,促使微处理器体系结构出现了重大的革新,即以“横向扩展”为特征的多核处理器成为了主流发展方向。多核技术的出现使得微处理器的性能得到了显著的提高,同时对存储系统的设计与技术进步提出了更高的要求。高速缓存Cache一直是处理器内的核心部件,也是决定处理器系统性能的关键因素之一。处理器与主存间的速度差距在多核结构下更为突出,改善存储层的结构设计以及探索高效的管理调度技术以提高Cache资源效率便成了多核处理器研究领域中的一个热点。同时,为研究多核处理器技术而发展出的多核处理器系统模拟平台也正在不停地创新和发展中。所以本文围绕多核处理器体系结构、多核处理器模拟系统M5和Cache存储层的相关优化技术开展了深入的研究。首先分析各种典型多核处理器的体系结构。在基于Cache存储层结构的多核处理器分类研究中发现:采用共享缓存的多核处理器芯片CMP (Chip Multi Processor)结构具有资源利用率高、扩展性强、能耗低等优点,是目前多核处理器架构的主流发展趋势。所以本文选择共享高速缓存Cache的多核处理器C...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:160 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究工作背景
1.1.1 VLSI 及微处理器技术发展趋势
1.1.2 多核处理器的发展与挑战
1.1.3 多核架构对处理器cache 技术的影响
1.2 国内外相关研究现状
1.2.1 NoC 多核互连通信结构研究
1.2.2 多核处理器中Cache 存储优化技术
1.2.3 分布式Cache 数据前瞻技术
1.3 论文主要研究内容及创新点
1.4 论文的组织结构
2 多核处理器体系结构分析
2.1 SMT、CMP 与CMT
2.2 多核处理器结构体系分类
2.2.1 同构与异构CMP
2.2.2 共享与私有二级缓存CMP
2.3 本章小结
3 多核处理器 Cache 存储层技术研究
3.1 Cache 结构与工作方式
3.2 分布存储一致性机制
3.2.1 基于监听Snoop-Based 一致性协议
3.2.2 基于目录Directory-Based 一致性协议
3.3 Cache 抖动与公平性研究
3.3.1 Cache 抖动问题
3.3.2 Cache 分配公平性分析
3.4 Cache 替换策略与调度
3.4.1 传统单核处理器Cache 替换算法
3.4.2 多核处理器中的Cache 调度与管理策略
3.4.3 完全公平调度CFS 与高速缓存公平调度
3.5 Cache 层相关技术研究与分析
3.5.1 扩展组索引缓存ESC
3.5.2 缓存协作 CC 和动态溢出与接收DSR
3.5.3 三维叠层3D-Stacked 存储
3.6 本章小结
4 性能评估模型与 M5 测试
4.1 基于“执行-传送”关系的分析模型
4.1.1 ETAM 单核处理器Cache 层分析模型
4.1.2 扩展的EETAM 多核处理器分析模型
4.1.3 模型参数评估
4.2 模块化模拟系统 M5 与测试基准
4.2.1 M5 模块化模拟系统平台
4.2.2 M5-ALPHA 处理器芯片及结构
4.2.3 基准测试程序集SPEC CPU 2006
4.3 M5 模拟系统的测试实验
4.3.1 Pseudo-LRU 等替换算法仿真
4.3.2 测试实验及结果分析
4.4 本章小结
5 共享 Cache 的衍生插入与提升策略 HPIP 调度设计
5.1 缓存异常行为分析
5.1.1 “死块”Dead-Block 现象
5.1.2 多核共享Cache 的冲突与污染
5.2 LIP 替换算法的分析与优化
5.2.1 LIP 与LRU 缓存替换算法比较
5.2.2 基于LIP 算法的性能优化
5.2.3 实验结果与分析
5.3 多核处理器衍生插入与提升策略HPIP 缓存调度设计
5.3.1 Cache 调度的选择、插入与提升分解
5.3.2 共享缓存伪线程独立的HPIP 算法设计
5.3.3 多线程Cache 的调度实例对比
5.3.4 面向处理器性能与共享Cache 效率的实验与分析
5.3.5 面向共享缓存公平性的实验与分析
5.4 本章小结
6 线程感知动态插入 TADIP 自适应机制研究
6.1 基于Cache 需求特征的应用分类
6.2 共享缓存的TADIP 自适应机制
6.2.1 动态插入选择机制DIP
6.2.2 线程独立的TADIP-I 机制
6.2.3 线程反馈的TADIP-F 机制
6.3 自适应策略选择机制APE 设计
6.3.1 基于核个数的APE 与监测模块MRM 设计
6.3.2 互补竞争Cache 采样分组选择方案
6.3.3 专用竞争分组SD 的数量分析与论证
6.4 模拟实验与分析
6.5 本章小结
7 总结与展望
7.1 工作总结
7.2 后续工作的展望
致谢
参考文献
附录
A. 作者攻读博士学位期间发表或录用的论文
B. 作者在攻读博士学位期间参加的科研项目
C. 作者在攻读博士学位期间参加的学术活动
【参考文献】:
期刊论文
[1]片上多核处理器共享Cache划分的公平性研究[J]. 方娟,蒲江,张欣. 计算机工程与设计. 2010(15)
[2]DOOC:一种能够有效消除抖动的软硬件合作管理Cache[J]. 吴俊杰,杨学军,曾坤,张百达,冯权友,刘光辉,唐玉华. 计算机研究与发展. 2008(12)
[3]面向CMP体系结构的二级CACHE替换算法设计[J]. 张骏,樊晓桠,刘松鹤. 小型微型计算机系统. 2007(12)
[4]一种嵌入式处理器的动态可重构Cache设计[J]. 张毅,汪东升. 计算机工程与应用. 2004(08)
[5]简单访问模式下假共享Cache行抖动的消除[J]. 金国华,陈福接. 计算机学报. 1994(06)
本文编号:3442125
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:160 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究工作背景
1.1.1 VLSI 及微处理器技术发展趋势
1.1.2 多核处理器的发展与挑战
1.1.3 多核架构对处理器cache 技术的影响
1.2 国内外相关研究现状
1.2.1 NoC 多核互连通信结构研究
1.2.2 多核处理器中Cache 存储优化技术
1.2.3 分布式Cache 数据前瞻技术
1.3 论文主要研究内容及创新点
1.4 论文的组织结构
2 多核处理器体系结构分析
2.1 SMT、CMP 与CMT
2.2 多核处理器结构体系分类
2.2.1 同构与异构CMP
2.2.2 共享与私有二级缓存CMP
2.3 本章小结
3 多核处理器 Cache 存储层技术研究
3.1 Cache 结构与工作方式
3.2 分布存储一致性机制
3.2.1 基于监听Snoop-Based 一致性协议
3.2.2 基于目录Directory-Based 一致性协议
3.3 Cache 抖动与公平性研究
3.3.1 Cache 抖动问题
3.3.2 Cache 分配公平性分析
3.4 Cache 替换策略与调度
3.4.1 传统单核处理器Cache 替换算法
3.4.2 多核处理器中的Cache 调度与管理策略
3.4.3 完全公平调度CFS 与高速缓存公平调度
3.5 Cache 层相关技术研究与分析
3.5.1 扩展组索引缓存ESC
3.5.2 缓存协作 CC 和动态溢出与接收DSR
3.5.3 三维叠层3D-Stacked 存储
3.6 本章小结
4 性能评估模型与 M5 测试
4.1 基于“执行-传送”关系的分析模型
4.1.1 ETAM 单核处理器Cache 层分析模型
4.1.2 扩展的EETAM 多核处理器分析模型
4.1.3 模型参数评估
4.2 模块化模拟系统 M5 与测试基准
4.2.1 M5 模块化模拟系统平台
4.2.2 M5-ALPHA 处理器芯片及结构
4.2.3 基准测试程序集SPEC CPU 2006
4.3 M5 模拟系统的测试实验
4.3.1 Pseudo-LRU 等替换算法仿真
4.3.2 测试实验及结果分析
4.4 本章小结
5 共享 Cache 的衍生插入与提升策略 HPIP 调度设计
5.1 缓存异常行为分析
5.1.1 “死块”Dead-Block 现象
5.1.2 多核共享Cache 的冲突与污染
5.2 LIP 替换算法的分析与优化
5.2.1 LIP 与LRU 缓存替换算法比较
5.2.2 基于LIP 算法的性能优化
5.2.3 实验结果与分析
5.3 多核处理器衍生插入与提升策略HPIP 缓存调度设计
5.3.1 Cache 调度的选择、插入与提升分解
5.3.2 共享缓存伪线程独立的HPIP 算法设计
5.3.3 多线程Cache 的调度实例对比
5.3.4 面向处理器性能与共享Cache 效率的实验与分析
5.3.5 面向共享缓存公平性的实验与分析
5.4 本章小结
6 线程感知动态插入 TADIP 自适应机制研究
6.1 基于Cache 需求特征的应用分类
6.2 共享缓存的TADIP 自适应机制
6.2.1 动态插入选择机制DIP
6.2.2 线程独立的TADIP-I 机制
6.2.3 线程反馈的TADIP-F 机制
6.3 自适应策略选择机制APE 设计
6.3.1 基于核个数的APE 与监测模块MRM 设计
6.3.2 互补竞争Cache 采样分组选择方案
6.3.3 专用竞争分组SD 的数量分析与论证
6.4 模拟实验与分析
6.5 本章小结
7 总结与展望
7.1 工作总结
7.2 后续工作的展望
致谢
参考文献
附录
A. 作者攻读博士学位期间发表或录用的论文
B. 作者在攻读博士学位期间参加的科研项目
C. 作者在攻读博士学位期间参加的学术活动
【参考文献】:
期刊论文
[1]片上多核处理器共享Cache划分的公平性研究[J]. 方娟,蒲江,张欣. 计算机工程与设计. 2010(15)
[2]DOOC:一种能够有效消除抖动的软硬件合作管理Cache[J]. 吴俊杰,杨学军,曾坤,张百达,冯权友,刘光辉,唐玉华. 计算机研究与发展. 2008(12)
[3]面向CMP体系结构的二级CACHE替换算法设计[J]. 张骏,樊晓桠,刘松鹤. 小型微型计算机系统. 2007(12)
[4]一种嵌入式处理器的动态可重构Cache设计[J]. 张毅,汪东升. 计算机工程与应用. 2004(08)
[5]简单访问模式下假共享Cache行抖动的消除[J]. 金国华,陈福接. 计算机学报. 1994(06)
本文编号:3442125
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3442125.html