当前位置:主页 > 科技论文 > 计算机论文 >

面向大规模分布式共享内存系统的Cache一致性协议研究和实现

发布时间:2017-10-22 00:25

  本文关键词:面向大规模分布式共享内存系统的Cache一致性协议研究和实现


  更多相关文章: CC-NUMA Cache一致性协议 分布式共享内存 结点代理 一致性目录


【摘要】:CC-NUMA (Cache Coherent-Non Uniform Memory Access)作为一种典型的分布式共享内存多处理器架构,以其较高的可编程性和系统综合效能,成为高端服务器的主流技术之一。随着C C-NUMA系统规模不断扩大和处理器数量的增加,多核处理器间的Cache一致性问题愈发复杂,一致性协议的设计和实现优劣成为限制系统扩展的关键因素,对系统性能产生重要影响。本文的主要工作和创新点是:1)论文从Cache —致性协议出发,提出了一种面向两级一致性空间转换的结点代理的设计和实现方法,研究优化目录存储策略,降低目录开销,保证系统实现的可扩展性,实现高效并发访存冲突处理。基于结点代理构建多结点立方体互连的拓扑结构,实现高带宽、低延时的CC-NUMA系统。2)论文基于SystemC语言对多结点共享内存系统中的两级Cache一致性协议进行建模,并通过了仿真验证。使用处理器总线功能模型BFM和Agent协议模型构建4结点CC-NUMA模拟仿真系统,并通过API接口控制BFM在互连总线上发起CC事务,利用仿真器对结点代理模型进行功能验证。3)论文提出了两级Cache一致性协议引擎的芯片微结构实现方案,结合硬件链表机制实现多级协议流水线,利用目录Cache缩短目录信息访问延时,有效优化了目录的访问和处理,提高了CC协议包的处理效率。4)通过对结点代理的FPGA逻辑综合和移植,构建8路和16路FPGA原型系统,并进行实际的应用测试,针对lmbench测试得到的带宽和延时结果,分析了不同规模和配置模式下的系统加速比变化趋势。实验结果表明,本文研究的结点代理是对大规模分布式共享内存多处理器系统中Cache一致性协议的硬件具体实现,其基于多级一致性空间转换支撑高性能服务器的大规模扩展,有效支持高并发一致性访存和高效冲突处理,对系统计算性能和访存能力的性能提升具有积极意义。
【关键词】:CC-NUMA Cache一致性协议 分布式共享内存 结点代理 一致性目录
【学位授予单位】:中国科学院大学(工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP333.1;TP332
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 绪论10-18
  • 1.1 研究背景与意义10
  • 1.2 本课题的研究进展10-16
  • 1.2.1 多核处理器发展10-11
  • 1.2.2 CC-NUMA系统发展介绍11-13
  • 1.2.3 CC-NUMA系统国内外现状13-15
  • 1.2.4 多处理器系统Cache一致性15-16
  • 1.3 本文主要研究内容16-18
  • 第二章 Cache一致性协议研究18-30
  • 2.1 高速互连协议18-22
  • 2.1.1 监听策略18-20
  • 2.1.2 虚网络和虚通道20-21
  • 2.1.3 多处理器系统互连拓扑21-22
  • 2.2 Cache一致性研究22-27
  • 2.2.1 按序和乱序协议22-25
  • 2.2.2 资源预分配机制25-26
  • 2.2.3 并发访存冲突处理26-27
  • 2.3 层次化存储策略27-29
  • 2.3.1 多级Cache一致性目录27-28
  • 2.3.2 远端数据Cache28-29
  • 2.4 小结29-30
  • 第三章 协议建模30-42
  • 3.1 协议模型设计30-36
  • 3.1.1 总体框架设计30-32
  • 3.1.2 模块通信接口设计32-33
  • 3.1.3 协议引擎PE设计33-36
  • 3.2 多结点仿真系统构建36-41
  • 3.2.1 系统模拟器总体框架36-38
  • 3.2.2 验证系统拓扑结构38-40
  • 3.2.3 事务发生器和错误检查40-41
  • 3.3 小结41-42
  • 第四章 协议处理单元设计42-58
  • 4.1 两级Cache一致性协议域42-44
  • 4.2 协议处理引擎设计44-50
  • 4.2.1 RMPE44-48
  • 4.2.2 LMPE48-50
  • 4.3 一致性目录单元50-57
  • 4.3.1 目录策略和开销50-54
  • 4.3.2 数据目录缓存54-57
  • 4.4 小节57-58
  • 第五章 系统验证和性能分析58-72
  • 5.1 仿真验证58-63
  • 5.1.1 验证条件58-59
  • 5.1.2 BFM仿真和测试用例59-61
  • 5.1.3 验证结果和覆盖率61-63
  • 5.2 FPGA验证63-71
  • 5.2.1 FPGA平台构建和逻辑移植63-66
  • 5.2.2 LMBENCH时延测试66-68
  • 5.2.3 LMBENCH带宽测试68-71
  • 5.3 小节71-72
  • 第六章 结论与展望72-74
  • 参考文献74-78
  • 致谢78-80
  • 个人简历、在学期间发表的论文与研究成果80

【参考文献】

中国期刊全文数据库 前4条

1 Yuhuai Peng;Xiaoxue Gong;Lei Guo;Dezhi Kong;;A Survivability Routing Mechanism in SDN Enabled Wireless Mesh Networks:Design and Evaluation[J];中国通信;2016年07期

2 王恩东;陈继承;胡雷钧;公维峰;;基于紧耦合单跳步多平面架构的高端服务器设计[J];高技术通讯;2014年02期

3 王睿伯;卢锡城;卢凯;王绍刚;;面向CC-NUMA体系结构的事务内存冲突规避方法[J];计算机学报;2011年04期

4 邓让钰,谢伦国;一种高效SMP Cache一致性协议及其实现技术的研究[J];计算机工程与应用;2001年17期



本文编号:1075945

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1075945.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9a344***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com