当前位置:主页 > 科技论文 > 计算机论文 >

大规模键值分布式存储系统的设计与实现

发布时间:2018-04-21 21:45

  本文选题:分布式存储系统 + 散列 ; 参考:《电子科技大学》2013年硕士论文


【摘要】:随着互联网的不断发展,全球网络化的不断普及,海量信息的不断聚合,数据量保持指数级增长。面对当前的海量数据,传统的单机文件存储系统并不能提供其所需要的存储能力和高性能读、写需求,同时,传统文件系统的扩展性不佳也使得当数据业务需求发生变化时服务能力不足。鉴于此,本文中提出了一种新型的分布式键值存储系统的架构模型,该模型通过结合散列算法和一致性哈希算法,不仅解决了已有分布式系统中存在的扩展性问题和节点负载均衡问题,同时有效的避免了当机器数目发生改变时,数据移动代价过高的问题。本文的主要工作有: 第一,介绍了当前管理海量数据的主要问题,以及本文的研究动机。 第二,详细分析了已有的分布式存储系统,包括NFS系统,HDFS系统,DYNAMO系统等当前比较主流的分布式文件存储系统,这些系统的相关核心技术对于本文中设计的分布式存储系统具有良好的借鉴性和参考性。 第三,在相关技术准备完成后,本文设计了一种新的大规模键值分布式存储系统的架构方式,该系统使用三层的架构模式,同时在三层中都设计了良好的灾备方案,从前端服务器层,到最底层的数据节点层,都尽可能的在保证高效性的前提下设计了良好的灾备机制,虽然数据备份牺牲了一定的数据一致性,但仍可以很好的满足应用需求。 第四,完成系统设计后,本文中使用python语言对系统进行了仿真,将三层架构分解为三个实现模块,并将每一个模块再次详细拆分为不同功能的子模块,使得整个系统的耦合性降到最低。 第五,为了保证系统的功能完备性和可靠性,本文对该系统做了细致的测试,包括功能测试和性能测试,测试结果完全符合预期的设计目标。 第六,在论文的结束部分分析了一些可以优化本系统的技术和实现方式,并展望了分布式存储系统良好的发展前景。 本文中成功的设计并实现了一个新型的大规模分布式存储系统,,对分布式存储系统的发展具有良好的探索和实践意义。
[Abstract]:With the development of the Internet, the popularization of the global network and the continuous aggregation of massive information, the amount of data keeps increasing exponentially. In the face of the current massive data, the traditional single-machine file storage system can not provide the required storage capacity and high performance read and write requirements, at the same time, The poor scalability of traditional file systems also leads to inadequate service capacity when data business requirements change. In view of this, a new architecture model of distributed key-value storage system is proposed in this paper, which combines hash algorithm and consistent hash algorithm. It not only solves the problem of scalability and node load balancing in existing distributed systems, but also effectively avoids the problem of excessive cost of data movement when the number of machines changes. The main work of this paper is as follows: First, it introduces the main problems of managing massive data and the motivation of this paper. Secondly, the existing distributed storage system, including NFS system and DYNAMO system, are analyzed in detail. The core technologies of these systems have good reference and reference for the distributed storage system designed in this paper. Third, after the completion of the related technology preparation, this paper designs a new large-scale key-value distributed storage system architecture, the system uses a three-tier architecture model, at the same time in the three-tier design of a good disaster preparedness scheme. From the front-end server layer to the bottom layer of the data node layer, we have designed a good disaster preparedness mechanism under the premise of high efficiency. Although the data backup sacrifices some data consistency, it can still meet the application requirements very well. Fourth, after completing the system design, this paper uses python language to simulate the system, decomposing the three-tier architecture into three implementation modules, and dividing each module into sub-modules with different functions in detail. The coupling of the whole system is minimized. Fifthly, in order to ensure the functional completeness and reliability of the system, the system is tested in detail, including function test and performance test, and the test results are in line with the expected design objectives. Sixth, at the end of the thesis, we analyze some technologies and implementation methods that can optimize the system, and look forward to the future of distributed storage system. In this paper, a new large-scale distributed storage system is successfully designed and implemented, which has a good exploration and practical significance for the development of distributed storage system.
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333

【相似文献】

相关期刊论文 前10条

1 陈],殷新春;并行程序设计中的消息传递机制[J];扬州大学学报(自然科学版);2001年04期

2 杨_g剑;林波;;分布式存储系统中一致性哈希算法的研究[J];电脑知识与技术;2011年22期

3 李爱华,张衍杰;Windows98注册表使用探讨[J];山东工程学院学报;2001年04期

4 杨小小;;在重启中被替换的键值[J];办公自动化;2007年01期

5 张金兰,姚根龙;WINDOWS注册表简介[J];通信世界;1999年03期

6 刘跃军,李震;WINDOWS98注册表的研究[J];安阳师范学院学报;2000年04期

7 陈语林,曹尧谦,曹刚;中心机房软件环境的优化[J];实验室研究与探索;2001年05期

8 任润姣,吴洁;浅谈Windows注册表及其优化[J];河南商业高等专科学校学报;2002年06期

9 王治,虞芬;用VB编写自定义过程修改注册表[J];九江职业技术学院学报;2003年02期

10 孙孟乐,彭作华,刘孟贺;WINDOWS注册表进一步探索[J];洛阳工业高等专科学校学报;2001年02期

相关会议论文 前10条

1 赵辉;何连跃;;基于异构分布式存储系统的动态反馈负载均衡技术[A];第15届全国信息存储技术学术会议论文集[C];2008年

2 周天彤;薛磊;郑东;童天浩;;基于Reed-Solomon编码的容灾存储系统性能分析[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年

3 周松;王意洁;;EXPyramid:一种灵活的基于阵列结构的高容错低修复成本编码方案[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

4 王国仁;叶峰;王欣晖;于戈;郑怀远;;NOW环境下并行哈希连接算法的设计与实现[A];第十五届全国数据库学术会议论文集[C];1998年

5 朱鉴;张建;李淼;强静;杨攀;;面向民族语言信息处理的汉语分词方法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

6 刘群;冯丹;;基于层次结构的元数据动态管理方法的研究[A];第15届全国信息存储技术学术会议论文集[C];2008年

7 韩丽;雷振明;;对等网络的资源查找机制[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

8 严哲南;楼荣生;;窗口算法问题的解决方案[A];第十六届全国数据库学术会议论文集[C];1999年

9 范纪松;武欣嵘;;基于P2P的分布式哈希表算法优化分析[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年

10 楼荣生;施伯乐;;自调整的有序散列函数[A];第十届全国数据库学术会议论文集[C];1992年

相关重要报纸文章 前10条

1 本报记者 黄伟敏;带给你惊喜和快乐[N];计算机世界;2002年

2 ;开源和SaaS产品着手重构数据库[N];网络世界;2009年

3 林明;斩断恶意篡改浏览器主页的利益链[N];人民邮电;2009年

4 ;宽带WLAN制约因素分析[N];中国计算机报;2002年

5 ;反垃圾邮件 技术介绍和部署思路[N];中国电脑教育报;2005年

6 本报记者 朱晔;防火墙:网络安全第一关[N];计算机世界;2004年

7 浙江 裘文锋;BT下载攻防战[N];电脑报;2007年

8 ;“实现继承”是有害的[N];计算机世界;2007年

9 福建 俞木发;没有组策略Win7家庭版优化照做不误[N];电脑报;2010年

10 实习生 颜伟杰;如何应对“黑屏”引来的病毒侵袭?[N];科技日报;2008年

相关博士学位论文 前10条

1 王禹;分布式存储系统中的数据冗余与维护技术研究[D];华南理工大学;2011年

2 刘霖;分布式存储系统中的能耗管理策略研究[D];华南理工大学;2013年

3 万亚平;基于P2P的分布式存储系统可靠性及故障检测研究[D];华中科技大学;2010年

4 姚杰;分布式存储系统文件级连续数据保护技术研究[D];华中科技大学;2009年

5 宋玮;分布式存储系统中的节点自主性问题研究[D];华南理工大学;2010年

6 赵杠;对偶连接问题的哈希算法研究[D];复旦大学;2010年

7 宋建涛;对等计算中的若干问题研究[D];复旦大学;2004年

8 牛中盈;并行文件系统安全性研究[D];华中科技大学;2010年

9 李林;防火墙规则集关键技术研究[D];电子科技大学;2009年

10 王宁;网络编码在无线通信中的应用研究[D];北京邮电大学;2009年

相关硕士学位论文 前10条

1 邢屹;大规模键值分布式存储系统的设计与实现[D];电子科技大学;2013年

2 刘飞;基于云计算的分布式存储系统的研究和应用[D];西安工业大学;2012年

3 王伟娜;分布式存储系统中容错子系统的设计与实现[D];东北大学;2008年

4 王秀芬;对等网络分布式存储系统的研究[D];天津大学;2010年

5 张凯;分布式存储系统中节点修复问题研究[D];西南交通大学;2012年

6 冯光曦;分布式存储系统安全关键技术研究与实现[D];华中科技大学;2011年

7 王怡丰;面向非结构化分布式存储系统的性能分析系统研究[D];复旦大学;2012年

8 张明;基于网络编码的一种分布式存储系统应用设计[D];南京理工大学;2013年

9 孙程;基于纠删码的分布式存储系统的设计与实现[D];电子科技大学;2010年

10 舒敏;分布式数据存储机制与优化方法研究[D];西安电子科技大学;2013年



本文编号:1784219

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1784219.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户40510***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com