当前位置:主页 > 科技论文 > 计算机论文 >

基于最小修复带宽的分布式存储系统编码机制构造的研究

发布时间:2018-04-25 08:29

  本文选题:分布式存储 + 纠删码 ; 参考:《复旦大学》2014年硕士论文


【摘要】:随着大数据时代的到来,全球信息数据资源开始呈现出爆炸性增长。图灵奖获得者James Gray甚至提出了关于全球数据总量的摩尔定律:全球数据总量每18个月就将翻一番,也即未来每18个月就能产生出与人类有史以来全部数据总量相同规模的数据。为了满足大数据时代各种大规模存储应用的存储需求,人们开始越来越多地关注分布式存储技术。分布式存储系统(Distributed Storage System,DSS)就是利用一定的技术手段将原始数据分别存储在相互独立的若干台设备上,并能通过不同程度的数据冗余来提供对数据的可靠访问。然而分布式存储系统中相互独立的各个节点本身会因为各种原因发生失效。随着分布式存储系统规模的不断扩大,这种节点失效的情况出现得越来越普遍。因此,构建分布式存储系统需要面临的一个问题便是节点修复:为了使系统能够保持相同的可靠性,当一个存储了编码信息的节点发生失效后,必须在新的节点再生出丢失的编码信息。本文对采用纠删码的分布式存储系统进行研究发现,即使为了修复某一独立的失效节点,修复的过程也必需先恢复出完整的原始数据,再根据原始数据再生出有效的数据片段。为了更加有效地进行节点修复,降低修复带宽,提高存储效率,本文重点研究了基于最小修复带宽的分布式存储系统编码机制。Dimakis等人创造性地将网络编码技术与分布式存储结合起来,定义了针对节点修复问题的若干种再生码(Regenerating codes),并得到了存储容量与修复带宽之间的基本权衡关系。Wu等人在此基础上,利用最大距离可分离码(Maximum distance separable code)以及系统性(Systematic)码的特点设计了相应的系统性MDS编码(Systematic MDS codes)机制,当d=k+l时实现了理论上的最小修复带宽。本文分析比较了Wu的编码机制与其他实现最小修复带宽的编码机制,指出了Wu的构造客观上所存在的局限,然后对Wu提出的系统性MDS编码机制进行了拓展。拓展后的构造形式简洁,并且比Wu的构造更具一般性,在不提高有限域尺寸的前提下,使拓展后的构造在进行节点修复的过程中继续保持系统性属性与MDS属性,且使构造中系数的选择更加灵活,为节点修复提供更多的组合方式,进而可以满足更多应用场景和网络状况下的需求。
[Abstract]:With the arrival of big data era, global information data resources began to show explosive growth. Turing laureate James Gray has even proposed Moore's law on global data: global data will double every 18 months, that is, every 18 months in the next 18 months will produce data of the same size as all the data we have ever had. In order to meet the storage requirements of various large-scale storage applications in big data era, people began to pay more and more attention to distributed storage technology. Distributed Storage system DSS (distributed Storage system DSS) uses certain technical means to store raw data on several independent devices, and it can provide reliable access to data by varying degrees of data redundancy. However, the independent nodes in the distributed storage system will fail for various reasons. With the increasing scale of distributed storage system, this kind of node failure is becoming more and more common. Therefore, one of the problems in building a distributed storage system is node repair: in order to maintain the same reliability of the system, when a node that stores the encoded information fails, The missing encoding information must be reproduced at the new node. In this paper, the distributed storage system using erasure code is studied. It is found that even in order to repair an independent failure node, the complete original data must be restored first, and then the valid data fragments are regenerated according to the original data. In order to repair nodes more effectively, reduce repair bandwidth and improve storage efficiency, This paper focuses on the research of distributed storage system coding mechanism based on minimum repair bandwidth. Dimakis et al creatively combine network coding technology with distributed storage. In this paper, several kinds of regenerating codes for node repair are defined, and the basic trade-off between storage capacity and repair bandwidth is obtained. Wu et al. Based on the characteristics of maximum distance separable code and systematic system MDS code, the corresponding systematic MDS codes-mechanism is designed. The minimum repair bandwidth is realized when dl is used. In this paper, the coding mechanism of Wu is analyzed and compared with other coding mechanisms to realize the minimum repair bandwidth, and the limitations of Wu's construction are pointed out, and then the systematic MDS coding mechanism proposed by Wu is extended. The extended structure is simpler and more general than Wu's. Without increasing the size of the finite field, the extended structure keeps the systematic and MDS attributes in the process of node repair. It also makes the selection of coefficients in the structure more flexible, and provides more combination methods for node repair, which can meet the needs of more application scenarios and network conditions.
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP333

【共引文献】

相关期刊论文 前10条

1 李恩荣;陈明亮;龚文林;喻虹;韩申生;;鬼成像系统的互信息[J];光学学报;2013年12期

2 冯欣;曾周末;封皓;安阳;;基于小波信息熵的分布式振动传感系统的扰动评价方法[J];光学学报;2013年11期

3 朱联祥;李想;;基于子集矩阵的LDLC短环消除方法[J];电视技术;2014年03期

4 胡长明;刘凯;董翔;张礼奎;;多项目管理组织结构及其评价[J];广西大学学报(自然科学版);2014年01期

5 胡春;高玉琨;吴洪;;基于SCI-E的通信信息业官产学创新合作关系研究[J];北京邮电大学学报(社会科学版);2014年01期

6 丁凯;;研发行为的二元容介态构成与转化趋势研究——基于某航空制造企业研发人员的实证[J];广义虚拟经济研究;2014年02期

7 李赫;吕文岱;张雁;郭明累;;基于AHP与信息熵的制造企业财务风险预警研究[J];中国管理信息化;2014年12期

8 李国华;;无线传感器网络数据压缩技术的研究进展[J];智能计算机与应用;2014年03期

9 王鹏;常旭;王一博;王璐琛;翟鸿宇;;基于时频稀疏性分析法的低信噪比微震事件识别与恢复[J];地球物理学报;2014年08期

10 蔡赫;;海浪河秋季浮游植物群落结构及水质评价[J];现代农业科技;2014年20期

相关会议论文 前3条

1 Xiao Hu;Chao Huang;Wei Cai;;Road Boundary Detection Based On Information Entropy[A];第26届中国控制与决策会议论文集[C];2014年

2 孙惠娟;彭春华;易洪京;;大规模风电接入电网多目标随机优化调度研究[A];2012年江西省电机工程学会年会论文集[C];2012年

3 王鹏;常旭;王一博;王璐琛;翟鸿宇;;基于时频稀疏性分析法的低信噪比微震事件识别与恢复[A];中国科学院地质与地球物理研究所2014年度(第14届)学术年会论文汇编——工程地质与水资源研究室[C];2015年

相关博士学位论文 前10条

1 尹良;认知无线网络中频谱容量与频谱业务建模关键技术研究[D];北京邮电大学;2013年

2 熊小兵;微博网络传播行为中的关键问题研究[D];解放军信息工程大学;2013年

3 王妮妮;基于智能计算技术的时间序列分割及预测研究[D];大连理工大学;2013年

4 余子斌;水声双扩展信道空时Turbo通信系统[D];浙江大学;2014年

5 张昱;协作中继系统容量界及其无速率网络编码[D];浙江大学;2013年

6 罗雷;基于深度图绘制的三维视频编码技术研究[D];浙江大学;2013年

7 虞萍;影响企业电子商务成功的网站因素研究[D];中国农业大学;2014年

8 王素凤;中国碳排放权初始分配与减排机制研究[D];合肥工业大学;2014年

9 陈传红;近200年泸沽湖藻类沉积记录及其对气候变化的响应[D];华中师范大学;2012年

10 阿荣吉日嘎拉;呼和浩特市东郊农田鸟类群落结构及活动节律[D];内蒙古大学;2014年

相关硕士学位论文 前10条

1 赵泽盟;基于非正态分布假设下的高浓度地表臭氧预报模型的应用[D];北京化工大学;2013年

2 刘武;信息模型在数字化SOP规程中的应用与分析[D];南华大学;2013年

3 戴理;数据加解密过程逆向分析技术研究[D];解放军信息工程大学;2013年

4 李秀媛;小鹤立河水库浮游动物群落结构与多样性研究[D];东北林业大学;2013年

5 赵菲;扎龙湿地浮游生物多样性研究及水生态系统健康评价[D];东北林业大学;2013年

6 蔡赫;嫩江下游底栖动物群落结构及水质评价研究[D];东北林业大学;2013年

7 张昊;嫩江下游浮游动物群落结构动态特征及其与水环境因子的相关分析[D];东北林业大学;2013年

8 罗明新;TD-LTE-Advanced下行非码本波束赋形技术研究[D];哈尔滨工业大学;2013年

9 梁星云;不同森林经营模式对东北红松天然次生林群落生态特征的影响机制研究[D];广西大学;2013年

10 滕光耀;卫星导航系统中LDPC码的研究[D];哈尔滨工业大学;2013年



本文编号:1800561

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1800561.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9bf61***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com