RAID-6存储系统中故障修复问题研究
发布时间:2018-10-10 18:29
【摘要】:现代社会对信息技术的高度依赖,导致人们对数据存储的可靠性和可用性需求不断提高。然而,随着存储系统规模的不断扩大,以及廉价存储设备的广泛采用,导致当前存储系统中发生故障的概率不断提高。存储系统中通常采用容错技术来保证数据的可靠存储,一旦发生磁盘(或其他存储设备)故障,系统可以根据采用的容错技术,从存活磁盘读取一定量数据,重构出故障盘中的丢失数据。由于故障修复过程中从存活磁盘读取的数据量直接影响着系统的可靠性以及用户请求的服务性能。因此,如何进行有效的数据修复,最小化修复过程中所消耗的系统资源是存储系统中容错修复的关键性问题。本文主要研究了在基于RAID-6编码的存储系统中,发生磁盘故障时的数据修复问题,主要研究内容与贡献如下: (1)基于RDP码的单盘故障修复算法。 RDP码是存储系统中最常采用的RAID-6编码之一,它通过在系统中添加两个磁盘的冗余数据来保证任意两个磁盘同时故障时,数据不会丢失。本文研究了基于RDP码的单盘故障修复问题,分析了任意单个磁盘的故障修复过程中,从存活磁盘读取的数据量的理论下界,同时设计了一种混合修复算法RDOR-RDP (Row Diagonal Optimal Recovery-RDP),该算法综合利用RDP码的两类校验,行校验和对角线校验,共同修复单个故障盘中的数据,实现了修复过程中的数据读取量达到理论下界。此外,RDOR-RDP从系统中各存活磁盘读取等量的数据用于故障恢复,从而保证了修复过程中各存活磁盘的负载均衡。理论分析表明,RDOR-RDP在修复过程中的数据读取量与传统单盘修复算法相比减少了将近25%。模拟实验结果表明,与RDP码的传统单盘修复算法相比,RDOR-RDP的平均磁盘访问时间减少了15.16%~22.60%,总修复时间减少了5.72%~12.60%。 (2)基于EVENODD码的单盘故障修复算法。 EVENODD码是另一种常用的RAID-6编码策略,结合EVENODD码的编码特性,本文将RDP码单盘故障的混合修复思想应用于EVENODD码的单盘故障修复过程中。本文证明了在基于EVENODD码的存储系统中,任意单个磁盘故障时,数据读取量的理论下界。此外,为了保证修复过程中各存活磁盘的负载均衡,本文给出了从各存活磁盘读取等量数据进行修复的充分条件。结合数据读取量的理论下界和负载均衡的充分条件,本文为EVENODD编码设计了单盘修复算法RDOR-EVENODD (Row Diagonal Optimal Recovery-EVENODD),该算法实现了故障修复过程中的数据读取量达到理论下界,同时保证了各存活磁盘在故障修复过程中的负载均衡。与EVENODD码的传统单盘修复算法相比,RDOR-EVENODD同样减少了近25%的数据读取量。模拟实验结果表明,RDOR-EVENODD在总恢复时间以及平均磁盘访问时间方面均优于传统单盘修复算法。 (3)基于RAID-6码的扇区故障修复算法。 在RAID-6存储系统中,除了整盘故障之外,还存在其他的故障模式,例如磁盘部分扇区发生故障(也即磁盘中部分数据块发生丢失),磁盘和扇区同时发生故障等,这些故障模式同样影响着整个系统的可靠性。本文研究了在基于RAID-6码的存储系统中,任意故障模式下的数据修复问题。针对任意的RAID-6编码和任意的故障模式(单磁盘故障、多磁盘故障、磁盘扇区故障等),本文设计了一种用于描述故障模式的二分图模型。基于该二分图模型,本文给出了丢失数据块理论上可修复的充分必要条件。基于上述充分必要条件,本文设计了两种通用的修复算法,GSR (Graph Shrink Recovery)和IGSR (Improved Graph Shrink Recovery)。与现有的修复策略相比,GSR和IGSR可以修复任意故障模式下所有理论上可恢复的数据块,同时减少了修复过程中的计算开销。
[Abstract]:......
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP333
[Abstract]:......
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP333
【参考文献】
相关期刊论文 前1条
1 杨向东;数据存储——金融电子化的基石[J];中国金融电脑;2002年03期
相关博士学位论文 前1条
1 胡q,
本文编号:2262801
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2262801.html