面向存储网络的融合I/O模拟器设计与实现
发布时间:2024-03-12 23:33
在现有计算机系统结构中,要实现跨节点的数据存储操作,数据需要先经过本地网卡、远程网卡、远程内存才能到达远程存储设备。这一过程通常还需要远程节点操作系统和应用软件的参与才能完成。随着硬件技术的发展,存储设备的访问延迟大幅下降。为了进一步降低节点数据传输延迟,充分发挥存储设备的性能优势,本文设计了面向网络与存储的融合I/O设备模型UIO,通过让多个功能模块共享存储设备中的内存和数据通路,以简化跨节点数据存储的传输通路优化。并加入辅助计算功能实现数据处理操作,通过与可编程硬件的结合,可以让用户定制辅助计算模块,提高UIO设备的处理效率,扩展应用场景。设计并实现了面向key-value存储系统的UIO设备模拟器,使用4 kB长度value的情况下,与传统数据通路对比,远程put延迟可以降低31%,远程get延迟减少20%。综合指令延迟和指令使用频率对整体操作延迟进行分析,UIO设备在目标场景中预期可以达到比传统数据通路更低的延迟。
【文章页数】:15 页
【部分图文】:
本文编号:3926910
【文章页数】:15 页
【部分图文】:
图1UIO设备在系统中的位置
如图1所示,UIO设备是插于PCIe卡槽的I/O设备,同时具有存储设备和网络设备的功能,为了提供一定的数据处理能力,UIO设备还具有辅助计算功能。与SSD和网卡一样,UIO设备需要系统中的驱动程序支持,由驱动程序负责与设备的通信。如图2所示,UIO设备中具有指令队列、指令处理、D....
图4UIO设备多机模型
如图4所示,把多个设备映射到一个全局空间中。用户通过本地设备的接口就可以透明地操作全局空间,而不必感知到其他设备的存在。当系统中增加设备时,用户看到的是全局空间的扩展。GME控制数据的分布,并根据数据的分布规则把数据发送到相应的设备。如果是本地的数据就交给UTL模块处理,由UTL....
图5顺序分布
如图5所示,顺序分布把key分为多个范围,不同范围的数据组成不同的子表,Root表记录每个子表存储在哪个节点中。在UIO设备中,可以由GME记录每个子表的数据范围和节点信息,在查找范围时由GME把大的范围转换为对多个子表的查询,UTL则负责一个子表,根据查询返回结果。2.3.2....
图6UIO设备结构图
如图6所示,UIO设备模拟器的结构依照UIO设备的基本结构而设计。由指令队列和控制寄存器共同组成设备接口。其中指令队列分为AdminQueue和I/OQueue,每种Queue又由SQ和CQ组成。除了指令队列,主机还需要一些寄存器为设备进行初始化以及保持状态信息。在实际UIO....
本文编号:3926910
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3926910.html