当前位置:主页 > 科技论文 > 计算机论文 >

分布式文件存储系统副本管理方法研究

发布时间:2018-03-14 11:20

  本文选题:分布式文件系统 切入点:副本管理 出处:《浙江大学》2013年硕士论文 论文类型:学位论文


【摘要】:随着互联网、物联网等新型应用的蓬勃发展,全球数据呈现爆炸式增长,大数据成为应用系统的特点。分布式文件存储系统通过分布式的架构支持海量文件数据的存储,是非结构化大数据存储的核心技术。而副本管理可增强系统的可靠性和容错性、方便进行系统负载均衡和服务性能调优,是分布式文件存储系统的关键技术之一。论文分析分布式文件存储系统中副本管理的功能和流程,综合考虑了用户访问行为、负载均衡、系统代价等方面,提出一种新型的副本管理方法。 论文提出一种基于文件热度的动态副本管理方法。首先提出了一种多频率的文件热度算法,对文件多个周期的访问频率进行综合考虑来定量描述文件热度。同时,对于不同热度的文件,采用不同频率的热度更新策略。基于文件热度值,提出了包括副本数的调整方法,多频率的副本执行机制,副本放置位置的策略以及副本的一致性保证的副本管理方法。实验表明热度算法有效的解决了文件热度的统计周期与统计热度准确性之间的矛盾和用户的突发性访问问题,使得副本管理方法更加合理。 论文提出考虑负载均衡的实时副本策略。首先通过动态调整负载指标权重,设计了一种可动态自适应应用程序的负载均衡算法,然后提出了与负载均衡算法相结合的实时副本策略,增加了高热度副本的缓存机制和实时副本调度机制。最后通过实验测试验证了应用程序自适应的动态负载均衡算法中的合理性以及实时副本策略的有效性;两者配合使用对于系统性能有较大提升。 论文在钱塘分布式文件存储系统中实现了本文提出的副本管理方法,使系统在吞吐率、响应时间、负载均衡等方面都有了一定的提升。基于此存储系统的应用在JTang云盘,已被100多家企事业单位投入使用,效果良好。
[Abstract]:With the rapid development of new applications such as the Internet of things and the Internet of things, the global data is explosively growing. Big data has become the characteristic of the application system. Distributed file storage system supports the storage of massive file data through the distributed architecture. Replica management can enhance the reliability and fault tolerance of the system, facilitate system load balancing and service performance tuning. It is one of the key technologies of distributed file storage system. This paper analyzes the function and flow of replica management in distributed file storage system, and synthetically considers user access behavior, load balance, system cost, etc. A new replica management method is proposed. In this paper, a dynamic copy management method based on file heat is proposed. Firstly, a multi-frequency algorithm is proposed to quantitatively describe the heat of the file by synthetically considering the access frequency of multiple periods. For the files with different heat degrees, different frequency heat updating strategies are adopted. Based on the file calorific values, an adjustment method including the number of replicas is proposed, and a replica execution mechanism with multiple frequencies is proposed. The experiment shows that the heat algorithm can effectively solve the contradiction between the statistical cycle of document heat and the accuracy of statistical heat and the problem of user's sudden access. Make the copy management method more reasonable. In this paper, a real-time replica strategy considering load balancing is proposed. Firstly, a dynamic adaptive load balancing algorithm is designed by adjusting the load index weight dynamically. Then a real-time replica strategy combined with load balancing algorithm is proposed. The cache mechanism and real-time copy scheduling mechanism of high thermal copy are added. Finally, the rationality of the application adaptive dynamic load balancing algorithm and the effectiveness of the real-time replica strategy are verified by experimental tests. The combination of the two can improve the performance of the system. This paper implements the replica management method in the Qiantang distributed file storage system, which improves the throughput, response time and load balance of the system. The application of this storage system in JTang cloud disk. Has been more than 100 enterprises and institutions put into use, the effect is good.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333

【相似文献】

相关期刊论文 前10条

1 周涛,邱元杰,何进;LINUX下分布式文件系统的设计与实现[J];福建电脑;2005年01期

2 王迪;薛巍;舒继武;沈美明;;海量存储网络中的虚拟盘副本容错技术[J];计算机研究与发展;2006年10期

3 从零开始;;《完美国际》之动态副本——探秘黄昏圣殿[J];电脑知识与技术(经验技巧);2007年06期

4 噬天;;超炫顶级装备,成就强者梦想——完《完美国际》“黄昏圣殿”顶级装备面面观[J];电脑知识与技术(经验技巧);2007年08期

5 亓雪冬;李霞;梁鸿;邢常振;仝兆岐;;一种新型的数据网格动态副本策略(英文)[J];北京交通大学学报;2008年06期

6 赵燕;刘心松;邱元杰;周正娟;;基于数字有机体存储系统配额机制的设计与实现[J];成都信息工程学院学报;2009年01期

7 曾福兰;;什么叫草稿、定稿、正本、副本[J];中国档案;1981年01期

8 张升;《永乐大典》副本流散史[J];中国典籍与文化;2004年04期

9 亓雪冬;仝兆岐;何潮观;;快速瀑布模型动态副本创建策略研究[J];系统仿真学报;2008年15期

10 李静;;远程教育中资源副本创建时机决策机制[J];计算机工程与应用;2009年05期

相关会议论文 前10条

1 付伟;肖侬;卢锡城;;QoS感知的副本放置问题研究综述[A];第15届全国信息存储技术学术会议论文集[C];2008年

2 张桃洲;;没有诗——一首诗的副本[A];诗歌与社会学术研讨会论文集[C];2009年

3 赵武清;许先斌;王卓薇;;一种基于权重的数据网格副本替换策略[A];第15届全国信息存储技术学术会议论文集[C];2008年

4 张德明;;构建分布式声纳信号处理系统[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

5 刘辉兰;李陶深;葛志辉;;基于代理的分布式入侵检测系统中网络代理的相关技术研究[A];广西计算机学会2005年学术年会论文集[C];2005年

6 韩希先;李建中;;分布式有序表中一种有效的在线计划批量插入方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

7 郭柯;代璐;周林;;分布式并网发电系统孤岛检测方法综述[A];重庆市电机工程学会2010年学术会议论文集[C];2010年

8 李其莹;张洪霞;;配电网中实现小电流接地选线一种方案[A];华东六省一市电机工程(电力)学会输配电技术研讨会2002年年会山东电机工程学会交流论文集[C];2002年

9 周详;王龙明;;建立分布式防护的安全体系[A];中国烟草行业信息化研讨会论文集[C];2004年

10 高长寿;陈定方;郭蕴华;周丽琨;;分布式路由器级拓扑发现技术研究[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年

相关重要报纸文章 前10条

1 记者 刘赋 李俊;大多坦然亮副本[N];重庆商报;2000年

2 顾仁达;营业执照副本(网络版)的原理及使用[N];中国工商报;2000年

3 容若 译;美学者在英发现海地《独立宣言》唯一已知印刷副本[N];中国档案报;2010年

4 王家坝守堤者;寻找失落的世界[N];中国电脑教育报;2004年

5 北京市石景山区地税局 王圆圆;营业执照正副本是否应纳印花税[N];中国财经报;2002年

6 江西财经大学国际经贸学院 王善论;单据的页数与附件、正本与副本[N];国际商报;2003年

7 程鸿;昆腾数据管理软件StorNext3.0[N];计算机世界;2007年

8 晓京;做分布式呼叫中心[N];中国计算机报;2003年

9 记者 张磊;分布式能源技术研讨会在京召开[N];中国电力报;2004年

10 盖俊飞 林楠;分布式ISA防火墙与服务器的配置[N];电脑报;2003年

相关博士学位论文 前10条

1 刘晓茜;云计算数据中心结构及其调度机制研究[D];中国科学技术大学;2011年

2 魏青松;大规模分布式存储技术研究[D];电子科技大学;2004年

3 林琳;基于网格数据交换区的网格作业性能优化[D];吉林大学;2011年

4 李静;数据网格的资源管理相关策略及算法研究[D];重庆大学;2007年

5 王宇翔;分布式网络地理信息系统研究[D];中国科学院研究生院(遥感应用研究所);2002年

6 董红军;基于多Agent的分布式CAPP及工艺信息管理研究[D];西北工业大学;2000年

7 娄渊胜;基于构件的分布式防汛信息系统框架研究[D];河海大学;2002年

8 刘峰;仪用主从耦合分布式并行处理容错系统体系结构研究[D];浙江大学;2003年

9 王加虎;分布式水文模型理论与方法研究[D];河海大学;2006年

10 傅涛;基于数据挖掘的分布式网络入侵协同检测系统研究及实现[D];南京理工大学;2008年

相关硕士学位论文 前10条

1 蒋浩;分布式文件存储系统副本管理方法研究[D];浙江大学;2013年

2 郑硕;一种新的非集中副本一致性服务模型[D];大连理工大学;2010年

3 黄恺翔;云存储环境下副本管理策略研究[D];解放军信息工程大学;2012年

4 石飞燕;数据密集型计算中副本优化机制研究[D];武汉理工大学;2011年

5 李亮;基于域索引的P2P网络副本管理策略[D];大连理工大学;2013年

6 吴畏;面向云存储系统的副本策略研究[D];华中科技大学;2012年

7 匡士杰;云存储环境下分布式文件系统的副本策略研究[D];电子科技大学;2013年

8 王慧娟;数据网格中副本淘汰策略的研究[D];湖南大学;2010年

9 张昌远;基于蚁群的P2P网络副本一致性维护策略[D];大连理工大学;2013年

10 岑文峰;海量数据环境中副本动态一致性策略研究[D];华中科技大学;2012年



本文编号:1610994

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1610994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户658d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com