当前位置:主页 > 科技论文 > 计算机论文 >

分布式存储系统中基于纠错码的容错机制研究

发布时间:2020-05-17 07:28
【摘要】: 随着分布式系统与网络技术的不断发展,分布式存储系统在存储容量、性能、可扩展性等方面已取得了飞速进步,但同时在容错性方面也面临着巨大的挑战:现代的分布式存储系统往往由成百上千个存储节点组成,多个节点出现故障的可能性大大增加,因节点故障导致数据丢失会造成灾难性的后果。因此,如何设计高效、可靠的容错机制,已经是分布式存储系统中迫切需要解决的问题。 纠错码是通信领域中广泛采用的检测和纠正通信误差、提高信息传输可靠性的技术。而组通信服务是分布式系统中构建自治区域的重要方法,可保证系统在局部故障的情况下仍能稳定正常地运行。目前,组通信服务是分布式系统中实现容错的一项关键技术。 基于纠错码的容错机制将纠错码技术与组通信服务相结合,提出了基于纠错码的容错组,解决分布式存储系统中的容错问题。容错组是实现纠错码的存储节点集合,数据经过纠错码编码后保存在容错组相应的存储节点中。容错组中的存储节点利用组通信服务组织在一起,并通过协调合作提供高可用与高可靠的数据服务。出现节点故障时,可以利用容错组中其它节点保存的数据恢复出原始数据。容错组利用组视图记录当前组中成员列表,组中存储节点加入、退出、故障都将引起组视图的更新。为了方便数据的读/写与管理,容错组中引入了基于对象存储技术。系统运行时,容错组中的存储节点与元数据服务器、管理服务器进行消息通信,更新元数据服务器与管理服务器保存的容错组信息。 采取纠错码作为冗余策略的容错组需要减少计算校验数据带来的计算开销,并保证容错组中各存储节点数据一致。设计了容错组中基于组视图的I/O操作,包括读操作、写操作与更新操作。容错组中每一个存储节点都可以完成存储控制器的功能,客户端将I/O请求发送给任意存储节点,存储节点作为协调者再访问组中节点,完成请求。容错组的纠错码都采用系统码形式,编码后的数据块分为信息数据与校验数据。读操作中协调者可以直接访问保存信息数据的节点,只是节点故障时才需要译码恢复数据。数据第一次写入容错组需要编码,然后将编码后的数据存储到相应的节点中。根据纠错码理论,更新操作并不需要再次对数据进行编码,而是先读取已保存的信息数据,与更新的数据计算异或,再将信息数据与校验数据分别更新。为了保证更新数据的一致性,更新操作还需应用时间戳排序、两阶段提交、日志等技术。 为了保证容错组的稳定性与容错组中I/O操作的正确性,容错组需要及时检测出故障节点。设计了容错组中基于服务质量的QB-AFD故障检测器。为了探测出组中的故障节点,容错组的每个成员都要向其它成员发送心跳消息,同时监听来自其它成员的心跳消息。如果存储节点在超时时刻还没有接收到某节点的心跳消息,即开始怀疑该节点。故障检测需要满足速度与精度的要求,因此,QB-AFD故障检测器动态调整预期心跳消息到达时间与安全时间余量,以满足服务质量的评价指标。 利用组成员关系服务完成容错组的重构任务,设计了基于两阶段提交的视图更新算法2pc-VUA保证组中存储节点维护一致的全局组视图,并设计了节点加入算法负责在新加入容错组的存储节点中生成与其它成员一致的组视图。
【图文】:

系统结构图,分布式存储系统,系统结构图


2 基于纠错码的容错组2.1 分布式存储系统的体系结构随着高速网络、分布式系统的发展,分布式存储系统出现了集群、P2P、网格等系统架构。考虑到聚合 I/O 与分离元数据处理的需要,本文采取如图 2.1 所示的体系结构,分布式存储系统由客户机、元数据服务器、管理服务器、存储节点以及连接网络等组成,

分布式存储系统,包含文件,元数据服务器,元数据


如时间戳等。将节点组织为容错组是分布式系统中容错的一个重要手段,本文中 n 个存储节点 SN0, SN1,…,SNn-1组织成为一个容错组,如图 2.1。容错组可以由唯一的组ID(group_id)标识,,存储节点赋予[0,n-1]范围内的整数作为节点在组内的标识。文件可生成 n 个对象,并被发送到容错组中存储节点,被称为分条(stripe)。对象的大小和分条的宽度(分条跨越存储节点的数目)包含在对象属性中。对象 ID 的高 96 位作为分条 ID(stripe_id),同一分条内的对象 ID 高 96 位都是相同的。而对象 ID 的低 32 位是一个[1, n]范围内的整数,分布式存储系统中的 I/O 访问过程如图 2.2 所示:
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP333

【相似文献】

相关期刊论文 前10条

1 杨立本;陈家福;;维特比译码及其纠错能力的研究[J];山西电子技术;2008年05期

2 许凌云;许宗泽;刘旭;;基于纠错码和小波变换的彩色图像水印算法[J];信息与控制;2010年01期

3 夏竞;徐博侯;;参激随机共振及纠错码技术的应用[J];浙江大学学报(工学版);2006年08期

4 周勇敢;;新一代高性能纠错码——LDPC编解码介绍及应用分析[J];电脑知识与技术;2005年35期

5 刘炫,马骋,贾惠波;光盘存储中RS码与RSPC码的数学比较[J];科学技术与工程;2005年15期

6 闫玉德;C~3I系统通信子系统检测[J];火力与指挥控制;1995年02期

7 袁东风;;纠错编码技术在移动数字通信系统中的应用[J];无线电通信技术;1990年03期

8 卢晶;赵远东;杨雄;;稳定子量子纠错技术的分析研究[J];微计算机信息;2005年26期

9 何永忠;韩臻;李晓勇;;不可靠信道上抗主动攻击的组播认证[J];电子学报;2008年07期

10 ;DualWave打通硬盘瓶颈[J];电子与电脑;2001年12期

相关会议论文 前2条

1 杨文青;许肖梅;;水声通信不同调制方式下的Turbo码性能比较[A];中国声学学会2006年全国声学学术会议论文集[C];2006年

2 朱晓明;段胜超;王海明;杨广琦;张念祖;张慧;余晨;洪伟;;IEEE802.16宽带无线接入系统的分组Turbo码[A];2005'全国微波毫米波会议论文集(第一册)[C];2006年

相关博士学位论文 前3条

1 刘钢;分布式存储系统中基于纠错码的容错机制研究[D];华中科技大学;2007年

2 刘翠卿;纠错码信息隐藏的理论与应用研究[D];解放军信息工程大学;2007年

3 陈殿仁;激光目标识别与通信系统研究[D];中国科学院长春光学精密机械与物理研究所;2000年

相关硕士学位论文 前10条

1 张京玲;基于软件无线电新型纠错码的研究及其实现[D];中南大学;2007年

2 袁峗;群变换构成的多种BCH纠错码的研究和基于FPGA的实现[D];南京师范大学;2007年

3 李元;数字多媒体广播RS编解码算法研究和硬件设计[D];中国传媒大学;2007年

4 邓从政;二元BCH码译码算法的优化与应用[D];广州大学;2007年

5 徐小龙;基于纠错码的数字图像水印算法研究[D];青岛大学;2010年

6 戴鹏;无线数字通信中级联纠错码的研究与设计[D];武汉理工大学;2008年

7 唐春鸽;基于图像特征的半脆弱数字水印算法研究[D];辽宁大学;2012年

8 汤毅凡;基于Tornado码的分布式存储系统及其安全性研究[D];华中科技大学;2007年

9 万力铭;RS译码器的研究与实现[D];长春理工大学;2008年

10 辛明寿;RS码在车载无线通信中的应用[D];吉林大学;2006年



本文编号:2668157

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2668157.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户64ef6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com