当前位置:主页 > 科技论文 > 计算机论文 >

容错存储系统校验更新及修复优化技术研究

发布时间:2018-01-13 01:13

  本文关键词:容错存储系统校验更新及修复优化技术研究 出处:《中国科学技术大学》2017年硕士论文 论文类型:学位论文


  更多相关文章: 存储系统 纠删码 容错 校验更新 校验修复


【摘要】:近年来随着数据的爆炸式增长,数据的存储规模越来越大,传统的单机系统已经无法满足高速增长的数据存储需求。分布式存储系统使用大量廉价商用服务器通过网络互联,可以提供极强的服务能力和扩展能力。然而,随着集群规模的变大、存储设备的增多,存储节点失效已不是偶然事件。因此,分布式存储系统对数据的可靠性要求尤为突出。分布式存储系统常用的容错技术有两种,多副本技术和纠删码技术。纠删码技术相对于多副本技术在提供相同容错能力的前提下,所需的存储开销更小,因此被存储系统广泛采用。纠删码技术通过对数据切块,计算并存储一定的冗余数据,当发生不超过系统容错能力的节点失效时,可以利用存活节点的数据恢复出失效节点的数据。所以,为保证部署纠删码的存储系统的可靠性,在数据块更新的同时需要更新与之关联的校验数据;同时,当存储校验数据的节点失效时,快速的故障数据恢复对保证分布式存储系统的可靠性也同等重要。本文主要研究了部署纠删码的存储系统校验更新及修复优化问题,主要研究内容与贡献如下:(1)校验数据更新优化研究随着业务规模的增长,已有的存储系统往往无法满足上层应用更大的存储容量和更高的访问带宽需求。当应用需求超过存储系统的负荷时,需要增加新的存储介质到已有的系统中,并将部分数据迁移到新的存储设备上,以均衡负载和提供更大的访问带宽。然而,数据迁移会造成大量校验更新,由此给系统造成额外负载。本文针对扩容过程中的校验数据更新问题,提出了一种优化策略EPU(Efficient Parity Update Algorithm)。首先,EPU根据用户请求访问情况调整扩容顺序,以最大化利用用户请求节省校验更新引发的I/O;其次,EPU通过比较不同校验更新方式的系统开销,选择最佳的校验更新方式,并尽可能的聚合校验更新I/O以减小系统开销。相比于传统扩容方法采用固定的校验更新方式,使用EPU,既可以减少扩容过程引发的系统带宽开销,也能加快扩容过程的完成。(2)校验数据故障恢复优化研究分布式存储系统的规模越来越大,有的甚至达到几百上千台集群规模。庞大的节点数目造成节点故障频发,当发生节点失效时,需要将失效节点修复,以维持数据的可用性。并且,数据的修复速度应尽可能的快,因为如果修复时间过长,修复期间有可能发生更多节点失效,若失效节点数量超过系统的容错能力,将造成数据的永久丢失。因此,数据的快速修复对于系统的可靠性至关重要。本文提出了一种基于局部校验和全局校验相结合的新型编码ESRC(Efficient Single-failure Recovery Code)码,该编码可以高效地修复单个节点故障,与现有的常用纠删码相比,ESRC码可以提高单个校验节点的修复效率,并维持较低的存储开销。
[Abstract]:In recent years, with the explosive growth of data, data storage increasingly large scale, the traditional single machine system has been unable to meet the needs of the rapid growth of data storage. The distributed storage system using a large number of cheap commercial server through the network, can provide strong service capabilities and scalability. However, with the increase of the cluster size becomes large storage device, storage node failure is not accidental. Therefore, distributed storage system reliability requirement of data is particularly prominent. Fault tolerant technology commonly used in distributed storage system has two kinds, the multi technology and erasure codes. Erasure codes with respect to multi copy technology in the premise of providing the same fault tolerance, storage overhead required, therefore has been widely used in storage systems. Erasure codes based on data cubes, calculate and redundant data storage will not occur when. Nodes over the ability of fault failure, recovery can use survival data node failure node data. So, in order to ensure the correct deployment reliability storage system delete code of the data at the same time in block updates need to check update data associated with it; at the same time, when the node storing the check failure data, fault data a quick recovery to ensure the reliability of distributed storage system is equally important. This paper mainly studies the deployment of erasure code storage system check update and repair optimization problems, the main research contents and contributions are as follows: (1) study with the growth in business scale optimization and update the verification data storage system has been unable to meet the storage capacity of the upper application often more and more high access bandwidth demand. When the application needs more than storage system load, the system need to add new storage medium to existing, and Some of the data migration to the new storage device, in order to balance the load and provide greater access bandwidth. However, data migration will cause a large number of parity updates, thus to the system caused by the additional load. Based on the calibration data expansion process update problems, proposes an optimization strategy of EPU (Efficient Parity Update Algorithm) EPU. First, according to the user request access to adjust the expansion in order to maximize the user requests to save check caused by the update of I/O EPU; secondly, through the system overhead check update of check, choose the best way of updating, and as far as possible to reduce the I/O polymerization check update overhead compared to the traditional expansion. Using the method of fixed parity update methods, the use of EPU, can reduce the expansion process caused by system bandwidth overhead, can also speed up the expansion process. (2) check failure data Recovery optimization of distributed storage system increasingly large scale, some even up to hundreds of thousands of Taiwan. The number of nodes in large scale cluster nodes caused by frequent faults, when node failure, node failure will need repair, in order to maintain the availability of data. And, according to the number of repair speed should be as fast as possible, because if the repair time is too long, during the repair may occur more node failure, if the failure tolerance of node number over the system, will cause permanent data loss. Therefore, the reliability of the data for the rapid repair of critical systems. This paper proposes a new encoding ESRC local and global parity check based on the combination of Efficient (Single-failure Recovery Code) codes, the encoding can effectively repair single node failure, compared with the existing common erasure codes, ESRC codes can improve the single check node The repair efficiency and low storage cost are maintained.

【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP333

【相似文献】

相关期刊论文 前10条

1 ;领先的技术是应用的保证──贵州中行存储系统浅析[J];计算机周刊;2001年43期

2 李红;蓝光存储系统 光盘容量高达23G[J];信息记录材料;2004年01期

3 ;存储系统 金融行业应用卓越奖 医疗行业应用卓越奖[J];每周电脑报;2004年20期

4 诺拉;EMC Symmetrix DMX-3存储系统 超大容量 高速存取[J];中国计算机用户;2005年31期

5 谢世诚;;浪潮推出4Gb光纤存储系统[J];微型机与应用;2006年07期

6 ;昆腾分级存储系统[J];软件世界;2009年11期

7 ;超低功耗云存储系统或被地方政府看好[J];中国有线电视;2013年08期

8 汤赫男;;云存储系统的分析与应用研究[J];计算机光盘软件与应用;2013年24期

9 谌伟;;云存储系统的分析与应用探讨[J];数字技术与应用;2013年10期

10 雅君;跟上企业的匆匆脚步——利用HP SureStoreEXP256构筑企业存储系统[J];中国计算机用户;2000年08期

相关会议论文 前10条

1 赵志刚;;存储系统在企业信息化中的应用[A];2005年安徽通信论文集[C];2006年

2 黄晓峰;张杰;;矿井信息中心存储系统设计[A];安全高效矿井机电装备及信息化技术——陕西省煤炭学会学术年会论文集(2011)[C];2011年

3 孙哲;李昌银;;构建核电高可用云存储系统[A];2012电力行业信息化年会优秀论文专辑[C];2012年

4 焦超;周天彤;李祥学;李建华;;面向灾备的高性能可信存储系统设计[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年

5 汪位龙;;设计院存储系统建设初探[A];中国公路学会计算机应用分会2004年年会学术论文集[C];2004年

6 梅松竹;李宗伯;;Storage 7000系列混合存储系统分析[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年

7 王克敏;张玺;胡江凯;王毅涛;;NWP资料归档方法及其存储系统的应用[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年

8 孙哲;李昌银;;DeDu:基于云计算的冗余删除存储系统[A];电力行业新一代信息技术研讨会论文集[C];2011年

9 高小伍;党齐民;林晨;;校园网存储系统的研究与实现[A];中国高等教育学会教育信息化分会第十次学术年会论文集[C];2010年

10 宫海林;郭长国;苑洪亮;王怀民;;支持事务的非结构化数据聚合存储系统GSL[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

相关重要报纸文章 前10条

1 ;第三季度中国存储系统市场达19.1亿元[N];中国高新技术产业导报;2005年

2 本报记者 薛斐;服务:存储系统的灵魂[N];计算机世界;2002年

3 单群一;惠普推出全新一体化存储系统[N];中国税务报;2007年

4 ;浪潮推出4Gb光纤存储系统[N];人民邮电;2006年

5 ;今年第二季度 存储系统市场价值达12.6亿元[N];人民邮电;2006年

6 郭;日立推出普及型存储系统[N];计算机世界;2007年

7 陈耀光;朗登 扛起存储系统设计院的大旗[N];中国企业报;2001年

8 ;富士通存储系统全面升级[N];网络世界;2009年

9 ;EMC亚洲生产制造中心落户深圳[N];网络世界;2009年

10 临履;存储系统有了“设计院”[N];网络世界;2001年

相关博士学位论文 前10条

1 王福伟;列存储系统的数据安全与网络性能优化模型研究[D];燕山大学;2016年

2 张菁;大规模分布式纠删码存储系统中的高效数据传输技术研究[D];国防科学技术大学;2015年

3 沈志荣;纠删码存储系统性能优化研究[D];清华大学;2015年

4 黄志杰;容错存储系统中的MDS阵列码研究[D];华中科技大学;2016年

5 刘进军;云存储系统中基于溯源关系的文件查询与管理方法研究[D];华中科技大学;2016年

6 赵楠楠;分布式键值存储系统高效能数据布局技术研究[D];华中科技大学;2016年

7 宋振龙;面向超级计算的大规模并行存储系统关键技术研究[D];国防科学技术大学;2014年

8 陆承涛;存储系统性能管理问题的研究[D];华中科技大学;2010年

9 聂雪军;内容感知存储系统中信息信息生命周期管理关键技术研究[D];华中科技大学;2011年

10 罗东健;大规模存储系统高可靠性关键技术研究[D];华中科技大学;2011年

相关硕士学位论文 前10条

1 冯汉超;基于Hadoop的分布式副本策略研究[D];河北工程大学;2015年

2 张明;IaaS中基于热点数据的存储系统研究与实现[D];哈尔滨工业大学;2015年

3 蒋静远;基于数据通道的非结构化数据多存储系统[D];浙江大学;2015年

4 郭晖;面向高清视频监控的流存储系统设计与实现[D];电子科技大学;2015年

5 许孟杰;嵌入式快速存储模块的研究与实现[D];中国舰船研究院;2015年

6 何洁和;面向POI的分布式结构化存储系统存储引擎设计与实现[D];电子科技大学;2014年

7 王晓;混合存储系统高效快照技术研究[D];北京理工大学;2015年

8 邱登峰;基于Hadoop可公共审计云存储的设计与实现[D];大连理工大学;2015年

9 张致元;电子商品存储系统设计与研究[D];复旦大学;2014年

10 刘秉煦;云存储环境下的混合存储算法研究与实现[D];上海交通大学;2015年



本文编号:1416801

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1416801.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1993b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com