分布式文件系统性能建模及应用研究
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP333;TP181
【图文】:
默认情况下,每个 Chunk 块,将保存 3 个副本到不同的 Chunk 服务器上从而提高数据的可靠性。(3)为了简化设计,将 Master 服务器设计成单 Master 服务器架构。Maser 服务器责管理元数据及监视 Chunk 服务器的状态等。而不进行任何的文件数据交互。客户会缓存 Master 服务器返回的元数据信息,提高访问效率。(4)Chunk 服务器和 Client 不缓存任何文件数据,因为跑在 GFS 上应用访问的数文件比较大,很难被客户端缓存下来。不缓存文件数据可简化系统设计。(5)Chunk 大小的选择。 默认情况下,被设计成 64MB。出于以下几方面的考虑减少 Client 和平 Master 服务器的通信次数,优化数据传输效率。2.2.1.2 GFS 系统架构GFS文件系统是面向搜索引擎应用的分布式文件系统,采用将元数据和实际文件据相分离的设计思路。GFS的基本架构[17]如图 2-1 所示。
图 2-5 HDFS 读操作Fig. 2-5 Read operation of HDFS图 2-5 可看出,HDFS 读操作的基本流程包括:1)客户端首先调用 open()操作向 DistributedFileSytem 对象发送读文件请求2)DistributedFileSytem 对象再通过 RPC 与 NameNode 交互,获取文件的地3)客户端通过 FSDataInputStream 流对象读取数据,FSDataInputStreamode 和 DataNode 的 I/O。4)FSDataInputStream 流通过调用 read()操作分别从一个或多个 DataNode 读5)当客户端读取完数据后,将调用 close()操作。读取文件时,HDFS 的客户端首先从 NameNode 获取一系列 DataNode 地端直接与DataNode进行数据交互。这种客户端与DataNode直接检索数据 HDFS 同时处理大量的并发客户端请求,因为数据流只在 DataNode 间Node 仅仅处理块地址请求,而不提供数据服务。由于 NameNode 将元数据
【引证文献】
相关期刊论文 前2条
1 刘恋;郑彪;龚奕利;;分布式文件系统中元数据操作的优化[J];计算机应用;2012年12期
2 沈青;董波;肖德宝;;基于服务器集群的云监控系统设计与实现[J];计算机工程与科学;2012年10期
相关会议论文 前1条
1 张颖岚;李志男;王冰琪;卢絮;张亦扬;;智能电网大数据生命周期框架研究[A];2017年北京科学技术情报学会年会--“科技情报发展助力科技创新中心建设”论坛论文集[C];2017年
相关博士学位论文 前3条
1 胡慧;农业科技成果视频云存储方法与安全访问策略研究[D];中国农业大学;2018年
2 陈永艳;电力海量暂态数据存储与分布式IP网络安全评估研究[D];昆明理工大学;2016年
3 安思成;交互式配电网智能控制系统及其关键技术研究[D];华北电力大学(北京);2016年
相关硕士学位论文 前10条
1 高志栋;基于Ceph的分布式存储在数据中心的设计与实现[D];兰州大学;2018年
2 申立;面向部队疾控中心的云存储网关系统研究[D];华南理工大学;2017年
3 吴宇飞;基于大数据的网络用户行为分析[D];辽宁石油化工大学;2017年
4 李晨曦;分布式SVR在电力负荷预测中的研究[D];西安理工大学;2016年
5 洪亮;开源分布式存储系统Ceph测试及在桌面虚拟化平台中的应用[D];华南理工大学;2016年
6 高宗宝;基于HDFS的海量小文件读写策略研究[D];山东大学;2016年
7 徐彪;面向分布式文件系统的基准测试框架研究与设计[D];杭州电子科技大学;2016年
8 任思颖;基于大数据的网络用户行为分析[D];北京邮电大学;2015年
9 谢骏;海量数据存取服务系统设计与实现[D];国防科学技术大学;2014年
10 单旦骏;应用于OpenStack平台的无元数据服务器的海量网络存储系统设计[D];浙江大学;2014年
本文编号:2712889
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2712889.html