当前位置:主页 > 科技论文 > 计算机论文 >

网格化内存服务体系结构研究

发布时间:2020-04-14 08:17
【摘要】: 随着网络和数字技术的发展,快速增长的计算量和数据量对计算机的能力提出了更高的要求,而随着处理器高频和多核时代的到来,高性能计算机的频率提高日渐困难,内存瓶颈问题更加严重。同时,处理器、存储器等部件之间的紧密耦合,使得资源无法共享,限制了系统性能,提高了系统成本。网格化动态自组织计算机体系结构(Dynamic Self-organized computer Architecture based on Grid-component,DSAG)将计算机部件拆分为网格化的功能部件,打破了部件间的紧密耦合,并根据应用的需求进行动态聚合与重组,实现体系结构按需定制,并通过共享降低成本。随着光互连和可重构计算等技术的发展,实现可共享的网格化内存部件成为可能。 从应用特征看,数据密集型和网络密集型应用在快速增长,数据传输的开销已经超出计算的开销。从技术方面,逻辑所占用的芯片面积相比存储越来越小,功能裁剪和部署也比存储容易。从以上两方面看,“小计算、大存储”和“数据驱动”的特征越来越明显。那么以CPU为中心的系统设计就有可能转变为以内存为中心的设计。 本文基于DSAG思想、结合应用特征和技术趋势提出了以网格化内存服务为中心的系统结构(Grid Memory Service,GMS),并设计和实现了网格化内存服务器Memory Box(MBox)。具体如下: (1)提出了一种以网格化内存服务为中心的系统结构(GMS)模型。网格化内存服务是指将内存部件赋予网格化的特性,其特点是供需双方相互独立、动态请求和响应、具有一定的服务质量保证、具有统一的接口和访问模式。网格化服务模式可以解决由于处理器和内存紧密耦合带来的性能和成本问题;以网格化内存为中心的系统结构可以减小内存数据传输量,分散内存总线的压力,从而减小解决内存瓶颈的影响。针对GMS模型的特点,提出并分析了需要重点解决的关键技术问题,包括访问接口与编程模型、可扩展的架构和互连协议、智能内存和延迟隐藏等。GMS的核心部件是内存聚合体Memory Box,可以看作一种高速、大容量、智能化的多端口存储器。以Memory Box为载体,对GMS的关键技术进行研究。 (2)介绍了Memory Box的访问接口和编程模型。首先对应用模式和服务模式进行了分析,为了实现统一的访问接口和服务语义,定义了网格化内存访问协议GMAP(Grid Memory Access Protocol);编程库实现了GMAP协议,供客户端程序调用。为了适应不同的应用模式,访问接口单元通过协议转换桥实现客户端网络协议和MBox内部互连协议间的转换,兼容不同类型的客户端协议。设计和实现了一个基于光互连的可重构验证系统“小雨点1号”,用以验证以内存总线为接口实现远程内存访问的可行性。“小雨点”系统实现了DDR RAM协议和自定义的互连协议间的转换,在内存接口为DDR200时,硬件带宽达到10Gbps,接近内存带宽;用户级通信带宽达到285MB/s,也接近了用benchmark测试到的内存带宽。通过测试指出有必要实现MBox内内存到内存的直接内存存取(M2M-DMA)。 (3)基于光互连和串行通信技术提出了高扩展性的无背板堆叠式架构。为了实现高速、高扩展性的互连,设计和实现了一种轻量级、高带宽、低延迟、串行包交换的网格化内存互连协议GMIP(Grid Memory Interconnect Protocol)。对电互连总线和光互连总线的延迟构成做了对比分析,根据分析结果从互连协议的设计优化和互连效能两方面对消除延迟影响的方法进行了研究。针对甚短距离光互连的特点,对链路层和物理层进行了进一步优化或提出了优化原则,以简化协议模块结构、减小电路面积和功耗,进一步提高性能。链路层延迟可以降低到10个时钟周期。针对光互连的高带宽特性和光互连总线模型的特点,提出了以互连效能为评价方法,用带宽优势补偿额外延迟带来的影响,并给出了带宽和数据块大小的关系。 (4)在GMS中,利用丰富廉价的嵌入式处理器和控制逻辑,可以实现分布式智能化内存。以典型应用为基础分析了以CPU为中心的系统瓶颈和以分布式智能内存为中心的处理流程,定性说明了它对分散内存总线压力、消除内存瓶颈的作用。利用智能化内存,可以实现复杂的存储管理机制和精确的系统控制,并可以利用跨层协同降低存储管理开销。分析了以智能内存为基础的主动延迟隐藏方法,提出了主动内存模型和实现方法。 (5)实现了一个基于光互连的可重构的Memory Box原型验证系统,访存延迟可以达到微秒量级。利用验证平台进行测试,验证了MBox相对磁盘的性能优势,以及使用主动内存时对性能的提升效果。
【图文】:

增长趋势,和数


1.2 内存系统的需求内存作为计算机系统的核心部件,对它的要求主要体现在三个方面,一性能的需求,二是对降低成本的需求,三是适应应用特征的需求。1.2.1 内存容量和性能的需求随着互联网和数字媒体技术的发展,网络密集型和数据密集型应用在不统需要处理的数据量也在爆炸性增长,如图 1.2 所示[Halt03]。例如三维动画音视频、数据库等应用,对计算能力和存储能力有很高的要求。软件本身对在增加,例如 Window Vista 操作系统能够运行的最小内存配置就需要 512M的网络和数据密集型应用都是以数据库为基础的,,为了提高性能,in-mem应用越来越广泛。利用内存来实现大规模服务器的快速检查点(Checkpoin实现也具备非常大的优势。这些应用往往要求数据存取带宽要高、访问延迟性要高。多核处理器对数据的需求量更大、对内存性能的要求更高。

趋势图,性能差距,内存,趋势


速度是爆炸性的,如互联网通信带宽、磁盘容量等的技术都以超摩尔定律的速如此大量的信息都要经过内存才能被 CPU 处理,内存的容量就显得捉襟见肘,随着计算机应用领域的不断发展,应用程序对内存容量的需求不断扩大,甚对 CPU 主频的追求。存的性能瓶颈先,处理器的处理能力提高很快,而内存的带宽和延迟提高相对缓慢,导致能,限制了性能的提升,即众所周知的内存墙(“memory wall”)问题。如图 1.理器和内存间的性能差距在不断增大[Henessy02]。解决 memory wall 的问题,几种方法:提高内存模块的性能,如采用更快的 DDRII RAM 等;优化 Mem,如把内存控制器和处理器集成到一起等,例如 AMD 的 Opteron 处理器就集 内存控制器;采用更有效的 cache/RAM 管理技术,如预取等。但受限于动态的特点限制(如地址复用、电容充放电时间等),仍然存在很大延迟,而且大容可能集成到处理器中。随着多核处理器的出现,对内存的能力提出更高的需求y wall 问题更加严重。这实际上相当于拉长了处理器和内存间的距离。
【学位授予单位】:中国科学院研究生院(计算技术研究所)
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP333

【引证文献】

相关硕士学位论文 前1条

1 可灵智;高速并行光互连芯片的测试与验证分析[D];武汉理工大学;2010年



本文编号:2627090

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2627090.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户224fb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com