【摘要】:随着大数据时代的来临和数据科学发展的不断深入,被采集,存储和处理的数据量急剧膨胀,传统计算机体系架构中以“计算为中心”的模式,难以应对数据规模与数据处理能力之间日益突出的矛盾,现存的计算机体系架构面临着严峻的挑战和生存瓶颈。近年来,随着新型非易失性内存介质技术的兴起,打破传统的体系架构,构建大容量,非易失,高可靠的内存系统,将数据大量或整体存放于内存中,形成以内存为主体的新型内存计算模式,从而完成计算模式从以“计算为中心”向以“数据为中心”的转变,成为学术界和工业界关注的热点。该技术减少了数据存储的软件层次,降低了数据访问的延迟,提升了数据处理的性能,具备相当的创新价值和市场价值,成为学术界和工业界关注的热点。其中,将非易失性内存引入计算机内存系统中,构建既有易失性内存又有非易失性内存的内存系统,又成为研究热点中的热点,吸引了大量的学术界研究者和行业翘楚的目光。本论文以非易失性内存为介质背景,基于异构混合内存体系架构,以存储类的系统软件为研究对象,主要探讨非易失性内存介质引入后对软件设计带来的影响与变化,提出在异构混合内存体系架构下,存储类软件设计面临的挑战和解决方法,选取了具有代表性的存储类系统软件,文件系统和键值对数据库系统,详细阐述基于非易失性内存环境下文件系统以及键值对系统的设计原理,实现方法,数据一致性保障机制,实验验证等方面的问题。在文件系统层面,针对文件系统的数据一致性问题,对文件系统的数据一致性给出了层次划分,并针对较高层级的版本数据一致性给出了一种新型的多版本一致性保障机制,论证了该多版本一致性机制的有效性和正确性。针对非易失性内存有限的访问寿命,文件系统采用了日志型的数据更新方式,尽量保证对底层非易失性内存介质的均匀访问,提升系统的耐久性和非易失性介质的使用寿命,并通过实验的方法验证了日志型文件系统设计方法对非易失性内存介质的访问均衡的改善效果。在键值对系统层面,针对现有键值对系统在整个系统中所占据的位置和作用,提出不依靠文件系统直接将键值对存储在非易失性内存的存储方法,减少了存储软件栈的层级,降低了系统数据持久化的代价。同时,基于散列表为主要存储数据结构,分别在传统内存DRAM和新型非易失性内存NVM中上使用静态散列表和动态散列表,该设计有效地取得了系统性能和内存使用效率的平衡,解决了数据量不固定的前提下,散列表容量难以固定初始化的问题,大大提升了系统的可移植性和普适性。本文以非易失性内存为主要介质背景,以存储类系统软件为主要研究对象,以文件系统和键值对存储系统为具体研究对象,提出了基于非易失性内存环境下,存储类系统软件的设计和实现方法,并讨论了数据一致性保障机制的实现方法,提出了一种新型的,有效的数据一致性保障机制。本论文的主要工作及创新如下:1.设计并实现了一个异构混合内存文件系统HMFS,该文件系统基于异构混合内存体系架构,以非易失性内存为主要存储介质,具备多版本控制和版本一致性保障机制,实现了文件系统中较高级别的一致性保障层级,文件系统中对文件系统元数据和数据采用不同的更新方式,对于文件系统数据采用原地更新方式,并缓存一部分在DRAM中,以提高数据查找的速度,对于文件系统数据采用日志型的更新方式,以实现对内存介质的尽量均匀访问,增长NVM介质的使用寿命。该文件系统提出了一种基于图的多版本控制数据结构,并给出一系列的的多版本操作相关算法设计,该设计打破了传统基于树结构的多版本实现方法,提升了版本生成,删除和获取的性能,降低了文件系统元数据的体量大小,设计并实施了全面的实验方案,从性能,多版本有效性以及介质耐久性等多个方面评测了文件系统性能,多版本有效性和对底层非易失性内存介质的访问均衡。2.设计并实现了一套文件系统多版本实现机制,该机制以一种新型的支持多版本功能的数据结构和一套完整的版本控制算法组成,实现了版本控制的基本功能,如创建、读取、删除等,并实现了完全的多版本功能,即可基于已存于系统中的任一版本进行版本演化,子版本与父版本之间无严格的生成时间先后顺序限制,并可以基于多个版本进行版本合并等,该多版本控制机制有效地提升了版本生成,读取和删除的性能,并实现了空间利用效率的提升。该多版本机制同时支持逆向查找功能,可以确定同一个文件属于哪些版本,并可以列出文件及所属版本的信息,该多版本控制机制有别于现存的多版本控制机制,全面支持多版本功能的所有操作,并降低了维护多版本所需的元数据量,在提升性能的同时取得了良好的空间利用效率。3.设计并实现了一个异构混合内存键值对系统LibreKV,该键值对系统基于异构混合内存体系架构,以非易失性内存为主要存储介质,使用静态散列表和动态散列表相结合的设计方法,实现系统性能和内存使用效率的平衡,提出一套动态扩展机制,实现散列表大小的动态扩展和内存的按需分配。利用传统内存的高性能特点,在DRAM中对键值对的读写请求进行快速响应,利用新型非易失性内存容量大,存储密度高的特点,完成对键值对的持久存储,并在DRAM和NVM中使用不同的散列表结构,DRAM中使用静态散列表结构,在静态散列表中使用布谷鸟散列算法,该方法可快速接收来自客户端的读写请求,并使静态散列表到达较高的使用效率。在NVM中,使用动态散列表和动态扩展算法,以实现散列表规模随实际数据量大小而动态改变的功能,提高了系统的自适应性和可扩展性。同时,针对键值对系统数据吞吐率高,对数据响应速度要求较高的特点,在数据一致性保障方面,摒弃了传统的使用高代价的硬件原语来保证内存写顺序的方法,采用了基于键值对校验和和合并检查点的一致性保障机制,该机制有效地结合了动态散列表和检查点机制的特性,有效降低了系统恢复时所需要检验的键值对个数,避免了因维护一致性而导致的过大的系统开销,提升了系统性能。4.提出一种基于校验和检查点技术的数据一致性保障机制,并将其应用于异构混合内存键值对系统LibreKV中,结合基于动态散列表的检查点机制,实现键值对系统数据一致性的保障,该一致性保障机制,避免了使用硬件原语保证写顺序来维护一致性的开销,降低了系统开销,提升了系统性能。该一致性保障机制可以充分利用键值对系统计算键值散列值的特性,利用简单的算法计算键值对散列值,并将散列值作为元数据一部分进行存储,作为发生系统异常和一致性检验时的依据。该方法非常适用于单个数据体量不太大的键值对存储系统,具有良好的应用系统场景,适应了系统的设计需求,完成了系统的基本要求,为在非易失性内存中设计有效的数据一致性保障机制维护数据的最终一致性并完成键值对在非易失性内存介质上的持久存储提供了一种参考方案。
【学位授予单位】:上海交通大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP333
【图文】: 学位论文 第二章 文件系统及存储类图 2 3 LSM 树两组件结构系统通常会设计一个上限机制,在当 C0 树因持续的写入操作达到或候,将会启动一个合并过程,来将某些连续的记录段从 C0 树中删除其过程在图 2 4 中给出。同时为了有效地利用磁盘,在根节点之下的续的多页面磁盘块上,类似的优化也被放在 B 树中,在匹配性的查缓存需求,对于根节点之外的节点使用 256KB 的多页面块大小。
的系统软件若干问题的研究 上海交通则保存在磁盘上去。在所有的组件对 (Ci-1,Ci) 之间都有一个异步当较小的组件 Ci-1 超过规定的阈值大小的时候,将其中的记录移动到LSM 树中的所有记录都会被检查到,对于一个精确匹配查询和区间查件。为了尽量简化搜索的范围,提高检索的效率,尽可能少地涉及少们还设计了许多种优化的方法,可以使搜索限制在这些组件的某一体来说,多组件 LSM 树的算法是,我们将一个具有组件 C0、C1、 树,将其索引树的大小伴随着下标的增加而增大,第一个分部最小其中 C0 组件是驻留在内存中的,其他组件则保存在磁盘上。在所有用一个异步的滚动合并的进程来负责在当较小的的组件 Ci-1 超过规转移到 Ci 中去,最终实现全部到达磁盘。
【相似文献】
相关期刊论文 前10条
1 钱璐;李弋;吴毅坚;赵文耘;;异构非易失性内存卷模式实现与应用[J];计算机应用与软件;2018年08期
2 ;创造存储的无限机会——非易失性内存再进化[J];电子与电脑;2006年11期
3 孙强;诸葛晴凤;陈咸彰;沙行勉;吴林;;带磨损均衡的小粒度非易失性内存管理机制[J];计算机科学;2018年S2期
4 ;科技信息[J];黑龙江科技信息;2011年32期
5 ;全新的非易失性内存——第二代3D Xpoint[J];今日电子;2018年08期
6 舒继武;刘志勇;;前言[J];计算机研究与发展;2018年09期
7 游理通;王振杰;黄林鹏;;一个基于日志结构的非易失性内存键值存储系统[J];计算机研究与发展;2018年09期
8 ;HOLTEK推出最新器件[J];电子制作;2008年05期
9 ;惠普工作站打造最强解决方案阵容[J];计算机与网络;2013年08期
10 任启;;Atmel力推系统方案 重点发展中国市场[J];世界电子元器件;2006年04期
相关重要报纸文章 前5条
1 阿君;IT管理走向智能化[N];电脑报;2010年
2 编译 沈建苗;新存储技术新在哪儿[N];计算机世界;2013年
3 于博;任启中国情 Atmel亚洲意[N];电子资讯时报;2006年
4 徐昕邋朱杰 刘洪宇 霍光;“胁迫”你用安全PC的四个理由[N];中国计算机报;2007年
5 顾国林;廉价+多能[N];计算机世界;2004年
相关博士学位论文 前3条
1 刘昊;面向非易失性内存的系统软件若干问题的研究[D];上海交通大学;2018年
2 龙林波;非易失性内存的磨损均衡与管理优化研究[D];重庆大学;2016年
3 陈咸彰;面向非易失性内存的文件系统与页面交换机制研究[D];重庆大学;2017年
相关硕士学位论文 前7条
1 董康平;基于非易失性内存和RDMA的低延迟分布式键值存储系统的设计与实现[D];上海交通大学;2018年
2 陈波;面向分布式非易失性内存的新型存储系统的设计与实现[D];江苏大学;2019年
3 秦杰杰;Redis数据库在非易失性内存上的交换技术的研究与实现[D];重庆大学;2018年
4 孙强;带磨损均衡的小粒度非易失性内存管理系统的设计与实现[D];重庆大学;2018年
5 刘志祥;基于RDMA的非易失性内存文件系统设计与实现[D];重庆大学;2018年
6 张小国;基于NVDIMM的非易失性内存系统的设计与实现[D];东南大学;2016年
7 贾扬;基于非易失性内存的用户态内存文件系统的设计和实现[D];重庆大学;2017年
本文编号:
2730122