SDFS分布式文件系统的研究与设计
发布时间:2020-10-31 06:39
随着信息技术的广泛应用,各种数据信息呈爆炸性的增长趋势。如何将数据信息进行有效地存储和管理已经变得越来越重要。同时它也对计算机存储系统在存储容量和存储访问速度等方面提出了越来越高的性能要求。传统的存储系统很难适应这种新的技术需求,而分布式存储系统技术则能比较好地解决这个问题,所以目前基于集群的分布式存储系统在计算机存储技术领域内已经成为主流存储平台。 分布式文件系统是分布式存储系统中的关键技术,所以研究和设计能够进行高效存储的分布式文件系统具有重要的现实意义。 本文对分布式文件系统中的数据布局算法、数据分片算法和存储节点设计进行了较深入的研究,论文作者所做主要研究工作和取得研究成果如下: 1、在认真分析和研究了现有分布式文件系统结构的基础上,提出了一种SDFS(SimpleDistributedFileSystem)分布式文件系统的原型结构。 2、研究了现有分布式文件系统的数据布局算法、数据分片算法和存储节点的布局方法,给出了SDFS分布式文件系统中的数据布局方法和数据分片算法,提出了SDFS分布式文件系统中元数据服务器的设计方法。 3、针对现有的分布式文件系统通常很难做到同时高效存储大小文件的问题,本文提出了一种新的二元存储节点布局方法。该布局方法的主要思想是在SDFS分布式文件系统中将存储节点划分为基于桶文件和key-value的两种类型。基于桶文件的存储节点存储大文件可以提供较高的文件访问吞吐量,而基于key-value的存储节点结构则能够比较好地处理小文件的存储访问,提供较低访问时延。本文对SDFS分布式文件系统进行了功能测试。并与PVFS1.6以及PVFS2.8并行 文件系统进行了相关性能对比。实验证明SDFS分布式文件系统达到了设计要求,在大小文件的读写方面有较好的性能优势。
【学位单位】:华南理工大学
【学位级别】:硕士
【学位年份】:2013
【中图分类】:TP333
【部分图文】:
第一 章 绪论 ( 一) R o u n d- R o b i n 布 局算 法 Ro u nd - Ro bi n 布局 算法 ,由 于 其一 致性 分 布 ,较 低的 计 算 复 杂度 ,在 众 多分 布 式 文 件系 统 中广 泛使 用 。标 准 Ro un d- Ro b i n 布 局算 法可 以 描述 如下 :设 数 据集 合 中 xXi∈ 为集合 中 的第 i 个数 据元 素, 存 储节 点 空间 D 中的 存储 节 点依 次编 号 为 0 ,1 , 2, .. . n ,则Ro u n d- Ro b i n 算法 将 ix 映射 到 i 模除 n 编号 的 存储 节 点 上。 在实 际应 用 中 一般 取 存 储节 点 的子 集 进行 上 述 映射 。P V F S [2 ]就采 用 此种 数 据布 局 算 法 ,如 图 1- 1 所示 。 从 图 中 可以 看 出 , 存 储 系 统 总 共 有 n = 5 台 存 储 节 点 。 此 文 件 取 编 号 为 {1 , 2,3}的 存 储 节 点 子 集 按 照Ro u nd - Ro b i n 算 法 进 行 映 射 。 清 华 大 学 研 究 人 员 在 Ro un d - Ro bi n 布 局 算 法 基 础 上 提 出SL A S 算法 [5 ],该 算 法在 理 论 上较 好 的解 决 了节 点 的 动态 添 加和 删 除 问题 。
图 1- 2 FA L L S = (0 , 2 ,6 , 2 ) 利用 PI TF A L L S 可 以将 一 个文 件 按照 Ro u nd - Ro b i n 算法 布 局到 P 个存 储节 点 。只调 整 PI TF A L L S 集 合 参 数 就 可 以 得 到 文 件 的 不 同 物 理 布 局 。 定 义 :inirs10 == U 和 偏 移 量of f s e t ,代 表一 个 待布 局 文件 ,其 中 of f s e t 表示 距离 该 文 件 起始 的 绝对 数据 块 数 。is 表一个 FA L L S , 代表 划 分 之后 的 子文 件 。 划分 要 求 满足 ss( (i j))ijI = φ ≠,即 任 何子 件之 间 没有 重 叠区 域 。以 ρ和 o ff s e t 作 为划 分 参数 , 按 Ro un d - Ro bi n 算法 将 文件 划 分 n 个子 文件 ,再 按 照 Ro un d - Ro bi n 方式 布局 到 存储 节 点 。图 1- 3 给出 了该 定 义下 数 据 局 例 子 , 其 中 of f s e t = 1 , ρ = ( 0 , 1 , - , 1 , 2 , 3 ) , 文 件 块 依 次 编 号 为 0~ 1 8 。 从 图可以 看出 , 该 方 法 在形 成 子文 件 和子 文件 布 局时 都采 用 了 Ro un d - Ro b i n 算 法, 但 通过 入元 组 划 分思 想 ,该 布 局 算法 比 Ro u n d - Ro b i n 更具 灵活 性 。
PVFS固定大小分片
【参考文献】
本文编号:2863585
【学位单位】:华南理工大学
【学位级别】:硕士
【学位年份】:2013
【中图分类】:TP333
【部分图文】:
第一 章 绪论 ( 一) R o u n d- R o b i n 布 局算 法 Ro u nd - Ro bi n 布局 算法 ,由 于 其一 致性 分 布 ,较 低的 计 算 复 杂度 ,在 众 多分 布 式 文 件系 统 中广 泛使 用 。标 准 Ro un d- Ro b i n 布 局算 法可 以 描述 如下 :设 数 据集 合 中 xXi∈ 为集合 中 的第 i 个数 据元 素, 存 储节 点 空间 D 中的 存储 节 点依 次编 号 为 0 ,1 , 2, .. . n ,则Ro u n d- Ro b i n 算法 将 ix 映射 到 i 模除 n 编号 的 存储 节 点 上。 在实 际应 用 中 一般 取 存 储节 点 的子 集 进行 上 述 映射 。P V F S [2 ]就采 用 此种 数 据布 局 算 法 ,如 图 1- 1 所示 。 从 图 中 可以 看 出 , 存 储 系 统 总 共 有 n = 5 台 存 储 节 点 。 此 文 件 取 编 号 为 {1 , 2,3}的 存 储 节 点 子 集 按 照Ro u nd - Ro b i n 算 法 进 行 映 射 。 清 华 大 学 研 究 人 员 在 Ro un d - Ro bi n 布 局 算 法 基 础 上 提 出SL A S 算法 [5 ],该 算 法在 理 论 上较 好 的解 决 了节 点 的 动态 添 加和 删 除 问题 。
图 1- 2 FA L L S = (0 , 2 ,6 , 2 ) 利用 PI TF A L L S 可 以将 一 个文 件 按照 Ro u nd - Ro b i n 算法 布 局到 P 个存 储节 点 。只调 整 PI TF A L L S 集 合 参 数 就 可 以 得 到 文 件 的 不 同 物 理 布 局 。 定 义 :inirs10 == U 和 偏 移 量of f s e t ,代 表一 个 待布 局 文件 ,其 中 of f s e t 表示 距离 该 文 件 起始 的 绝对 数据 块 数 。is 表一个 FA L L S , 代表 划 分 之后 的 子文 件 。 划分 要 求 满足 ss( (i j))ijI = φ ≠,即 任 何子 件之 间 没有 重 叠区 域 。以 ρ和 o ff s e t 作 为划 分 参数 , 按 Ro un d - Ro bi n 算法 将 文件 划 分 n 个子 文件 ,再 按 照 Ro un d - Ro bi n 方式 布局 到 存储 节 点 。图 1- 3 给出 了该 定 义下 数 据 局 例 子 , 其 中 of f s e t = 1 , ρ = ( 0 , 1 , - , 1 , 2 , 3 ) , 文 件 块 依 次 编 号 为 0~ 1 8 。 从 图可以 看出 , 该 方 法 在形 成 子文 件 和子 文件 布 局时 都采 用 了 Ro un d - Ro b i n 算 法, 但 通过 入元 组 划 分思 想 ,该 布 局 算法 比 Ro u n d - Ro b i n 更具 灵活 性 。
PVFS固定大小分片
【参考文献】
相关期刊论文 前10条
1 黄华;张建刚;许鲁;;蓝鲸分布式文件系统的客户端元数据缓存模型[J];计算机科学;2005年09期
2 庞丽萍,何飞跃,徐婕,岳建辉;PVFS寄生式元数据管理的设计与实现[J];计算机工程;2004年20期
3 伍卫国;方敏;吴小康;万群;胡雷钧;;PVFS客户端目录缓存设计与实现[J];计算机工程;2005年23期
4 杨德志;许鲁;张建刚;;蓝鲸分布式文件系统元数据服务[J];计算机工程;2008年07期
5 赵跃龙;谢晓玲;蔡咏才;王国华;刘霖;;一种性能优化的小文件存储访问策略的研究[J];计算机研究与发展;2012年07期
6 刘仲,周兴铭;基于动态区间映射的数据对象布局算法[J];软件学报;2005年11期
7 陈涛;肖侬;刘芳;付长胜;;基于聚类和一致Hash的数据布局算法[J];软件学报;2010年12期
8 余思;桂小林;黄汝维;庄威;;一种提高云存储中小文件存储效率的方案[J];西安交通大学学报;2011年06期
9 杨晶;刘天时;马刚;;分布式数据库数据分片与分配[J];现代电子技术;2006年18期
10 霍严梅;杨可新;胡亮;鞠九滨;;并行文件系统研究综述[J];小型微型计算机系统;2008年09期
相关硕士学位论文 前2条
1 许伟;分布式系统中的主机负载预测与动态负载均衡研究[D];中南大学;2004年
2 黎天翔;智能网络存储系统中的重复数据删除技术研究[D];华南理工大学;2012年
本文编号:2863585
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2863585.html