当前位置:主页 > 科技论文 > 计算机论文 >

随机化数据冗余方法及其在存储系统中的应用

发布时间:2018-07-17 07:29
【摘要】:利用网络分布式存储系统存储大数据已成为数据存储技术的发展趋势。网络分布式存储系统通常由数量众多的存储节点构成,由于人为或自然灾难的不可避免性,或是存储节点本身的低可靠性,常常会发生部分存储节点损坏或是无法及时使用的情况。而这一旦发生,存储其中的重要数据就会丢失或是不可用,造成极大的损失。因此,为了保证存储数据的安全性和可靠性,将数据冗余方法引入网络分布式存储系统成为一种必然。 已有的数据冗余方法,,如基于复制的数据冗余方法,基于阵列码的数据冗余方法等均存在种种不足,或者是存储冗余度过高,或者是容错能力有限,无法满足网络环境下分布式存储系统的需求。针对这一问题,本文首次以随机矩阵理论为基础,提出了一类新的数据冗余方法,称之为随机化数据冗余方法,并研究了其在两类具体的网络分布式存储环境——分布式数据容灾存储和传感器网络数据存储环境下的应用。本文的主要研究成果包括以下几个方面: 1.提出了性能优异的随机化数据冗余方法。 容错能力高、存储冗余度低、运算速度快、修复带宽低是网络环境下的分布式存储系统对数据冗余方法的需求。现有的数据冗余方法往往无法同时满足这些需求。本文以二元域上的随机矩阵为基础,提出了一类新的能满足上述需求的随机化数据冗余方法,给出了详细的文件存储、读取、以及修复算法。在本文提出的随机化数据冗余方法中:由源文件得到冗余文件、由冗余文件恢复出源文件均基于构造好的随机矩阵完成;随机矩阵满秩的高概率性质保证了冗余方法的高容错能力和低存储冗余度;同时,源文件和冗余文件之间的转换只依靠异或运算进行,降低了计算复杂度,提高了文件的处理速度;另外,随机矩阵的稀疏性也使得修复丢失的部分冗余文件数据所需的修复带宽有效降低; 2.提出了基于随机化数据冗余方法的低冗余度数据容灾方案。 数据容灾方案是网络分布式数据容灾存储系统抵御大规模存储节点损毁,保证数据生存能力的有效手段。传统的容灾方案通常以复制冗余方法为基础,以高存储空间代价换取一定的容灾能力。本文在随机化数据冗余方法的基础上,提出了一类具有低存储冗余度的数据容灾方案。与复制容灾方案相比,本文方案在提供相同容灾能力的前提下,可将系统的存储空间代价降到近似的理论最小值。本文方案的可行性和有效性在相关实验中得到了验证。 3.以随机化数据冗余方法为基础,提出了适用于无人值守传感器网络的具有低通信成本和低访问成本的分布式存储算法。 无人值守传感器网络可以看作是一类没有路由表的特殊网络分布式存储系统,其目的在于感知数据并将感知到的数据可靠地存储在整个网络中。本文以随机化数据冗余方法为基础,并与定向随机游走机制相结合,提出了适用于无人值守传感器网络的分布式存储算法。采用本文算法:可以有效地将网络中k个数据节点感知到的k个源数据包存储到网络所有的n个节点中(n k),形成n个存储数据包。当存储过程完成之后,即使有部分节点损坏而导致存储其中的存储数据包丢失,用户也能通过从任意k+12个以上未损坏节点的存储数据包还原出原来的k个源数据包。与具有代表性的基于LT码的算法相比,本文算法将存储过程中每个源数据包在网络中的通信次数从约nlnn降到了约n;同时,本文算法也将存储完成之后,用户为获取源数据包而需要访问网络节点的个数从大于k+100降到了约k+12。本文算法的可行性和有效性在数值实验中得到了验证。
[Abstract]:In order to ensure the safety and reliability of the storage data , it is inevitable to introduce the data redundancy method into the network distributed storage system in order to ensure the safety and reliability of the data .

This paper presents a new method of data redundancy , which is based on random matrix theory , and studies its application in two types of network distributed storage environment _ distributed data disaster storage and sensor network data storage environment . The main research results include the following aspects :

1 . A randomized data redundancy method with excellent performance is proposed .

This paper presents a new kind of randomized data redundancy method which can meet the above requirements . In this paper , a new kind of randomized data redundancy method is proposed , which is based on the random matrix on the binary domain , and the detailed file storage , reading and repair algorithm are presented .
the high probability property of the full rank of the random matrix ensures the high fault tolerance capability and the low storage redundancy of the redundancy method ;
meanwhile , the conversion between the source file and the redundant file is carried out only by XOR operation , the calculation complexity is reduced , and the processing speed of the file is improved ;
In addition , the sparsity of the random matrix also effectively reduces the repair bandwidth required to repair the missing partial redundant file data ;


2 . A low redundancy data disaster recovery scheme based on a randomized data redundancy method is proposed .

This paper presents a kind of data disaster recovery scheme with low storage redundancy . This paper presents a kind of data disaster tolerance scheme with low storage redundancy on the basis of duplication redundancy method . In this paper , the cost of storage space of the system can be reduced to the approximate theoretical minimum value under the precondition of providing the same disaster tolerance . The feasibility and effectiveness of this paper are verified in the relevant experiments .

3 . Based on the data redundancy method , a distributed storage algorithm with low communication cost and low access cost for unattended sensor networks is proposed .

An unattended sensor network can be regarded as a kind of special network distributed storage system without routing table . The purpose of this paper is to sense the data and store the perceived data reliably in the whole network .
At the same time , the algorithm also reduces the number of access network nodes from more than k + 100 to about k + 12 for acquiring source data packets . The feasibility and effectiveness of the algorithm are verified in numerical experiments .
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP333

【相似文献】

相关期刊论文 前10条

1 李国华,刘宝玲,沈树群;用于区域监测的无线传感器网络数据去冗余研究[J];微电子学与计算机;2005年09期

2 张兵令;付熙徐;张丹珏;;数据仓库的建立与维护的一个实例[J];微型电脑应用;2006年02期

3 季飞;;关系数据库规范化应用研究[J];科技资讯;2007年36期

4 王继林;;预测与可变长编码在图像压缩中的应用[J];现代计算机(专业版);2008年09期

5 韩佳兵;和敬涵;薄志谦;张浩;郭显达;;集成保护中冗余数据处理的软件设计[J];南方电网技术;2009年04期

6 韩涛;杨金民;严坤;;基于冗余信息抑制的传感网低耗分簇算法[J];微计算机信息;2010年13期

7 庞艳阁;王娟;田宾;;交换机汇聚技术在我校的应用[J];科技信息;2010年10期

8 李军;李永树;;天然气管线的快速三维建模方法研究[J];测绘;2010年04期

9 余蓓敏;;单片机抗干扰处理技术的探讨[J];安徽电子信息职业技术学院学报;2008年04期

10 郭向勇;傅国强;吕利昌;赵怡滨;曹璞;;模糊推理和聚类分析的信息融合应用研究[J];微计算机信息;2010年13期

相关会议论文 前10条

1 郭建奎;张忠平;朱扬勇;;一种处理生物数据库中数据冗余的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

2 董斌;张敏情;张薇;杨晓元;;分层门限Byzantine Quorum系统构造方案[A];中国电子学会第十六届信息论学术年会论文集[C];2009年

3 华陈权;;CRC与多重冗余结合实现RAM数据纠错[A];首届信息获取与处理学术会议论文集[C];2003年

4 柳懿;王向军;嵇斗;;高压变电站中测量设备的抗干扰研究[A];2010中国仪器仪表与测控技术大会论文集[C];2010年

5 陈进才;程伟;陈希;周功业;;寄生存储冗余机制与实现技术[A];第15届全国信息存储技术学术会议论文集[C];2008年

6 赵志刚;;存储系统在企业信息化中的应用[A];2005年安徽通信论文集[C];2006年

7 朱平;朱建涛;高剑刚;蒋金虎;;高性能计算存储关键技术研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

8 周博;宿绍莹;陈曾平;;基于CPCI总线的宽带雷达数据传输存储系统设计[A];全国第二届信号处理与应用学术会议专刊[C];2008年

9 焦超;周天彤;李祥学;李建华;;面向灾备的高性能可信存储系统设计[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年

10 周功业;周江;陈希;陈进才;;寄生存储原理及实现机制[A];第15届全国信息存储技术学术会议论文集[C];2008年

相关重要报纸文章 前10条

1 丁吉文 王军强;烟台市电子文件数据冗余处理技术研究课题通过专家鉴定[N];中国档案报;2007年

2 本报记者 顾文;Radware高效狙击数据冗余[N];通信产业报;2006年

3 朗飞;IBM“冰立方”就像搭积木[N];中国计算机报;2006年

4 李想 徐晋;福州电业局研发个人文件安全存储系统[N];中国电力报;2006年

5 郭涛;MediaGrid既不是SAN也不是NAS[N];中国计算机报;2007年

6 ;IBM收购存储解决方案公司[N];计算机世界;2007年

7 本报记者  张峰;知己知彼建存储(上)[N];网络世界;2006年

8 森林;NAS资源存储系统[N];中国电脑教育报;2002年

9 ;HDS推出企业入门级存储系统[N];计算机世界;2005年

10 ;戴尔EMC打造新一代高容量存储系统[N];人民邮电;2004年

相关博士学位论文 前10条

1 肖宜龙;随机化数据冗余方法及其在存储系统中的应用[D];电子科技大学;2013年

2 张万松;支持压缩域查询的XML数据压缩方法研究[D];哈尔滨工程大学;2005年

3 周正达;信息存储系统中重复数据删除技术的研究[D];华中科技大学;2012年

4 田敬;对等存储系统中的数据可用性与安全性研究[D];北京大学;2007年

5 罗东健;大规模存储系统高可靠性关键技术研究[D];华中科技大学;2011年

6 王禹;分布式存储系统中的数据冗余与维护技术研究[D];华南理工大学;2011年

7 陶钧;海量数据P2P分布式稳固存储方法与优化研究[D];国防科学技术大学;2008年

8 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年

9 陆承涛;存储系统性能管理问题的研究[D];华中科技大学;2010年

10 聂雪军;内容感知存储系统中信息信息生命周期管理关键技术研究[D];华中科技大学;2011年

相关硕士学位论文 前10条

1 颜彦文;数据冗余处理技术在轨道交通AFC系统中的应用[D];上海交通大学;2012年

2 胡宇光;网上银行交易数据仓库系统设计与实现[D];新疆大学;2006年

3 石磊庆;基于HDFS的云存储系统数据安全性研究[D];北京邮电大学;2013年

4 Elizabeth Olule(伊丽莎白);RARE:能量高效的目标跟踪协议[D];中南大学;2008年

5 李亚龙;基于网络编码的P2P直播数据传输策略研究与实现[D];电子科技大学;2009年

6 吴昊;基于HDFS的分布式文件系统数据冗余技术研究[D];西安电子科技大学;2011年

7 符永康;云存储中数据安全关键技术研究及系统实现[D];北京邮电大学;2013年

8 朱建伟;深空探测中多光谱图像压缩的算法设计及FPGA实现[D];哈尔滨工业大学;2006年

9 张淑芝;广域传感器数据库中缓存与查询技术的研究[D];燕山大学;2006年

10 刘猛;基于P2P的分布式存储系统的研究与实现[D];哈尔滨工程大学;2008年



本文编号:2129605

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2129605.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12c7b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com