基于Alluxio的数据高可用部署策略的研究与优化
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP333
【图文】:
第 2 章 Alluxio 与副本冗余技术相关介绍本章首先介绍 Alluxio 的架构及相关数据管理机制,然后分析了副本冗余的概念,结合其特性指出了设计上的要点。2.1 Alluxio 数据管理机制内存分布式文件系统 Alluxio,负责透明化底层存储,提供统一的 API 给予不同的计算框架,处于大数据生态的中间层,链接着底层存储与上层计算框架。如图 2-1 所示,其加速了大数据计算框架中系统的数据读写速度。Allux用挂载或直接依赖的方式支持现有的大多数底层大数据存储系统,然后提供包装好的访问接口给不同的上层计算框架,降低了海量数据存储系统的迁移代价本节主要介绍 Alluxio 的架构和各种对数据的管理机制。
图 2-2 Alluxio 系统架构图主节点 Master 是 Alluxio 集群的主控节点,管理着整个文件系统的目录该目录下所有文件的元数据,也负责与集群中的所有 Worker 节点联络,通信以确保目录与相关文件元数据的实时性。从节点 Worker 节点管理着本地数据层,一般可以分为内存存储与非内储,而非内存存储继续按磁盘响应速度细分,则可划分为 SSD 和 HDluxio 对其并未限制分层个数,但业界一般设为 3 层,即 MEM,SSD(固盘)与 HDD(硬盘驱动器)层。Worker 节点对自身的数据变更通过日志进本地目录,同时通过心跳机制对 Master 发送自身状态与存储数据的信客户端 Client 用于向用户应用提供访问接口,客户只需要通过该接口来存储于 Alluxio 中的数据,即做到了底层节点交互对上层应用操作透明的原则,从而简化开发程序的复杂度。
Master 与 Worker 间存在心跳机制,周期性地互相通信以维护数据信息,保证数据与节点之间的映射关系。在 Alluxio 中,Master 首先将用户对数据的请求进行划分处理,根据保存于 Master 节点中的数据-节点映射关系,分别交予不同节点响应。因为统一命名空间的关系,如果用户请求的是 Alluxio 内部存储外的文件,则会交予底层存储 UFS 来对请求进行响应。2.1.2 底层存储支持Alluxio 针对目前流行的底层存储,诸如 GCS、S3、Ceph、Swift、HDFS等,都设计了相应的挂载接口。用户即使是面对需要统合多种存储系统中的数据才能进行计算的工作,通过 Alluxio 文件系统挂载多种不同的底层存储系统就可轻易实现任务目标。底层存储将数据从原先基于磁盘的存储移动到Alluxio,同时自身的原数据能够给 Alluxio 提供最后的可靠性保障。Alluxio通过挂载和透明命名机制管理自身存储和底层存储。
【参考文献】
相关期刊论文 前7条
1 左方;何欣;;一种基于蚁群算法的云存储副本动态选择机制研究[J];计算机应用研究;2015年11期
2 陶永才;张宁宁;石磊;卫琳;;异构环境下云计算数据副本动态管理研究[J];小型微型计算机系统;2013年07期
3 李新华;;浅谈大数据时代的机遇与挑战[J];通讯世界;2013年11期
4 赵洋;;淘宝TFS深度剖析[J];数字化用户;2013年03期
5 祝家钰;肖丹;;云计算架构下的动态副本管理策略[J];计算机工程与设计;2012年09期
6 石刘;郭明阳;刘浏;沈玉良;许鲁;;基于反馈机制的动态副本数量预测方法[J];系统仿真学报;2011年S1期
7 周功业;雷伟;陈进才;;基于对象存储系统中的热点数据平衡策略[J];华中科技大学学报(自然科学版);2007年12期
相关会议论文 前1条
1 胡忠平;;大数据时代背景下档案管理探讨[A];“决策论坛——企业管理模式创新学术研讨会”论文集(上)[C];2017年
相关博士学位论文 前2条
1 郭力争;云计算环境下资源部署与任务调度研究[D];东华大学;2015年
2 吴晨涛;对象存储系统中热点数据的研究[D];华中科技大学;2010年
相关硕士学位论文 前5条
1 董文菁;基于Alluxio的数据高可用管理技术的研究与优化[D];哈尔滨工业大学;2017年
2 李聪;HDFS元数据管理的高可用性优化技术研究[D];哈尔滨工业大学;2016年
3 张明;IaaS中基于热点数据的存储系统研究与实现[D];哈尔滨工业大学;2015年
4 周小玉;HDFS分布式文件系统存储策略研究[D];电子科技大学;2015年
5 蒋浩;分布式文件存储系统副本管理方法研究[D];浙江大学;2013年
本文编号:2749613
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2749613.html