云存储环境下分布式文件系统的副本策略研究
本文关键词: 云存储 副本策略 负载均衡 一致性 出处:《电子科技大学》2013年硕士论文 论文类型:学位论文
【摘要】:随着互联网的高速发展,网络上产生的数据量呈爆炸式的增长,对这些数据的存储成为了计算机领域研究的热点。传统的存储方式,比如存储区域网络和网络附加存储因为其存储容量和性能存在瓶颈,价格昂贵,,不易扩展等原因,应用范围受到限制。云存储采用分布式文件系统为核心,硬件设备价格低廉,可扩展性好。副本技术提高了系统的可靠性、可用性和性能的同时,也带来了负载均衡,网络带宽开销,一致性等问题。 本文分析了当前典型的分布式文件系统,结合云存储环境下的业务特征,研究了相应的副本策略,重点考虑系统访问的效率和性能,负载均衡,数据的一致性等问题,并根据这些需求设计和实现了分布式文件系统中的副本管理模块。本文的主要工作包括以下内容: (1)提出了基于一致性哈希的副本放置策略。传统的分布式文件系统副本放置位置主要通过元数据中心服务器存储,当系统并发访问量很大时,元数据服务器将成为系统的瓶颈。基于一致性哈希的副本放置策略很好的解决了文件检索,存储设备扩展和失效的问题。引入虚拟节点映射,极大地减少了系统设备的改变带来的数据迁移。同时对设备按照存储能力增加权重属性,更好的提高了系统的负载均衡。 (2)提出了基于文件热度的副本调整策略。该策略以文件的请求次数为基础,结合服务器的负载,动态地调整副本数量,提升了系统的性能和效率。同时,辅以副本压缩策略,对长时间没有访问的文件副本压缩,在保证数据可靠性和可用性的同时,节省了系统的存储空间。 (3)提出了基于用户请求的副本一致性策略。该策略在对副本一致性维护的同时,充分考虑到了避免增加系统开销。同时,为了防止长期没有用户访问的文件不一致而使得数据的可靠性降低,副本失去冗余备份的作用,采用定时更新的机制,在系统空闲的时候将系统中副本各版本更新到一致状态。
[Abstract]:With the rapid development of the Internet, the amount of data generated on the network is increasing explosively. The storage of these data has become a hot topic in the field of computer. For example, the storage area network and network additional storage are limited because of the bottleneck of storage capacity and performance, expensive and difficult to expand, etc. Cloud storage uses distributed file system as the core, and the hardware is cheap. The replica technology not only improves the reliability, availability and performance of the system, but also brings some problems such as load balancing, network bandwidth overhead, consistency and so on. In this paper, the typical distributed file system is analyzed, and the corresponding replica strategy is studied based on the business characteristics of cloud storage environment. The system access efficiency and performance, load balance, data consistency and so on are considered. The replica management module in distributed file system is designed and implemented according to these requirements. The main work of this paper includes the following contents:. This paper proposes a replica placement strategy based on consistency hashing. The traditional distributed file system replica location is stored mainly through metadata center server. Metadata server will become the bottleneck of the system. The replica placement strategy based on consistency hash solves the problems of file retrieval, storage device extension and invalidation. It greatly reduces the data migration caused by the change of the system equipment, and increases the weight attribute of the device according to the storage capacity, thus improving the load balance of the system. (2) A copy adjustment strategy based on file heat is proposed. This strategy is based on the number of requests of files, and dynamically adjusts the number of copies in combination with the load of the server, which improves the performance and efficiency of the system. At the same time, it is supplemented by a copy compression strategy. The compression of long time unvisited copies of files saves the storage space of the system while ensuring the reliability and availability of the data. (3) A replica consistency policy based on user request is proposed. This policy takes full account of avoiding system overhead while maintaining replica consistency. At the same time, In order to prevent the file inconsistency which has not been accessed by the user for a long time, the reliability of the data is reduced and the replica loses the role of redundant backup. In order to update each version of the copy in the system when the system is idle, the mechanism of timing update is adopted to update each version of the copy to the same state.
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333;TP316.4
【参考文献】
相关期刊论文 前10条
1 拓守恒;;云计算与云数据存储技术研究[J];电脑开发与应用;2010年09期
2 冯幼乐;朱六璋;;CEPH动态元数据管理方法分析与改进[J];电子技术;2010年09期
3 李东升,李春江,肖侬,王意洁,卢锡城;数据网格环境下一种动态自适应的副本定位方法[J];计算机研究与发展;2003年12期
4 伍文静;程耀东;汪璐;武杰;陈刚;;面向本地分布式存储系统的动态副本策略[J];计算机工程与应用;2010年12期
5 周婧;王意洁;阮炜;李思昆;;面向海量数据的数据一致性研究[J];计算机科学;2006年04期
6 侯孟书;王晓斌;卢显良;任立勇;;一种新的动态副本管理机制[J];计算机科学;2006年09期
7 田颖,许鲁;分布式文件系统中的负载平衡技术[J];计算机工程;2003年19期
8 陈宇;董健全;;非结构化P2P网络中的副本管理策略[J];计算机工程;2008年18期
9 陈全;邓倩妮;;云计算及其关键技术[J];计算机应用;2009年09期
10 唐川;;浅谈云计算的概念问题[J];科技情报开发与经济;2010年10期
相关硕士学位论文 前6条
1 付惠惠;一种分布式存储管理原型系统客户端软件的设计与实现[D];北京交通大学;2011年
2 林松涛;基于Lustre文件系统的并行I/O技术研究[D];国防科学技术大学;2004年
3 邓自立;云计算中的网络拓扑设计和Hadoop平台研究[D];中国科学技术大学;2009年
4 孙鹏;面向SaaS应用的多租户海量存储系统设计与实现[D];浙江大学;2010年
5 黄晓云;基于HDFS的云存储服务系统研究[D];大连海事大学;2010年
6 龚高晟;通用分布式文件系统的研究与改进[D];华南理工大学;2010年
本文编号:1506205
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1506205.html