面向大规模分布式共享内存系统的Cache一致性协议研究和实现
发布时间:2017-10-22 00:25
本文关键词:面向大规模分布式共享内存系统的Cache一致性协议研究和实现
更多相关文章: CC-NUMA Cache一致性协议 分布式共享内存 结点代理 一致性目录
【摘要】:CC-NUMA (Cache Coherent-Non Uniform Memory Access)作为一种典型的分布式共享内存多处理器架构,以其较高的可编程性和系统综合效能,成为高端服务器的主流技术之一。随着C C-NUMA系统规模不断扩大和处理器数量的增加,多核处理器间的Cache一致性问题愈发复杂,一致性协议的设计和实现优劣成为限制系统扩展的关键因素,对系统性能产生重要影响。本文的主要工作和创新点是:1)论文从Cache —致性协议出发,提出了一种面向两级一致性空间转换的结点代理的设计和实现方法,研究优化目录存储策略,降低目录开销,保证系统实现的可扩展性,实现高效并发访存冲突处理。基于结点代理构建多结点立方体互连的拓扑结构,实现高带宽、低延时的CC-NUMA系统。2)论文基于SystemC语言对多结点共享内存系统中的两级Cache一致性协议进行建模,并通过了仿真验证。使用处理器总线功能模型BFM和Agent协议模型构建4结点CC-NUMA模拟仿真系统,并通过API接口控制BFM在互连总线上发起CC事务,利用仿真器对结点代理模型进行功能验证。3)论文提出了两级Cache一致性协议引擎的芯片微结构实现方案,结合硬件链表机制实现多级协议流水线,利用目录Cache缩短目录信息访问延时,有效优化了目录的访问和处理,提高了CC协议包的处理效率。4)通过对结点代理的FPGA逻辑综合和移植,构建8路和16路FPGA原型系统,并进行实际的应用测试,针对lmbench测试得到的带宽和延时结果,分析了不同规模和配置模式下的系统加速比变化趋势。实验结果表明,本文研究的结点代理是对大规模分布式共享内存多处理器系统中Cache一致性协议的硬件具体实现,其基于多级一致性空间转换支撑高性能服务器的大规模扩展,有效支持高并发一致性访存和高效冲突处理,对系统计算性能和访存能力的性能提升具有积极意义。
【关键词】:CC-NUMA Cache一致性协议 分布式共享内存 结点代理 一致性目录
【学位授予单位】:中国科学院大学(工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP333.1;TP332
【目录】:
- 摘要5-6
- Abstract6-10
- 第一章 绪论10-18
- 1.1 研究背景与意义10
- 1.2 本课题的研究进展10-16
- 1.2.1 多核处理器发展10-11
- 1.2.2 CC-NUMA系统发展介绍11-13
- 1.2.3 CC-NUMA系统国内外现状13-15
- 1.2.4 多处理器系统Cache一致性15-16
- 1.3 本文主要研究内容16-18
- 第二章 Cache一致性协议研究18-30
- 2.1 高速互连协议18-22
- 2.1.1 监听策略18-20
- 2.1.2 虚网络和虚通道20-21
- 2.1.3 多处理器系统互连拓扑21-22
- 2.2 Cache一致性研究22-27
- 2.2.1 按序和乱序协议22-25
- 2.2.2 资源预分配机制25-26
- 2.2.3 并发访存冲突处理26-27
- 2.3 层次化存储策略27-29
- 2.3.1 多级Cache一致性目录27-28
- 2.3.2 远端数据Cache28-29
- 2.4 小结29-30
- 第三章 协议建模30-42
- 3.1 协议模型设计30-36
- 3.1.1 总体框架设计30-32
- 3.1.2 模块通信接口设计32-33
- 3.1.3 协议引擎PE设计33-36
- 3.2 多结点仿真系统构建36-41
- 3.2.1 系统模拟器总体框架36-38
- 3.2.2 验证系统拓扑结构38-40
- 3.2.3 事务发生器和错误检查40-41
- 3.3 小结41-42
- 第四章 协议处理单元设计42-58
- 4.1 两级Cache一致性协议域42-44
- 4.2 协议处理引擎设计44-50
- 4.2.1 RMPE44-48
- 4.2.2 LMPE48-50
- 4.3 一致性目录单元50-57
- 4.3.1 目录策略和开销50-54
- 4.3.2 数据目录缓存54-57
- 4.4 小节57-58
- 第五章 系统验证和性能分析58-72
- 5.1 仿真验证58-63
- 5.1.1 验证条件58-59
- 5.1.2 BFM仿真和测试用例59-61
- 5.1.3 验证结果和覆盖率61-63
- 5.2 FPGA验证63-71
- 5.2.1 FPGA平台构建和逻辑移植63-66
- 5.2.2 LMBENCH时延测试66-68
- 5.2.3 LMBENCH带宽测试68-71
- 5.3 小节71-72
- 第六章 结论与展望72-74
- 参考文献74-78
- 致谢78-80
- 个人简历、在学期间发表的论文与研究成果80
【参考文献】
中国期刊全文数据库 前4条
1 Yuhuai Peng;Xiaoxue Gong;Lei Guo;Dezhi Kong;;A Survivability Routing Mechanism in SDN Enabled Wireless Mesh Networks:Design and Evaluation[J];中国通信;2016年07期
2 王恩东;陈继承;胡雷钧;公维峰;;基于紧耦合单跳步多平面架构的高端服务器设计[J];高技术通讯;2014年02期
3 王睿伯;卢锡城;卢凯;王绍刚;;面向CC-NUMA体系结构的事务内存冲突规避方法[J];计算机学报;2011年04期
4 邓让钰,谢伦国;一种高效SMP Cache一致性协议及其实现技术的研究[J];计算机工程与应用;2001年17期
,本文编号:1075945
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1075945.html