Geo-distributed云存储服务中数据副本放置策略的研究
发布时间:2017-04-29 09:13
本文关键词:Geo-distributed云存储服务中数据副本放置策略的研究,由笔耕文化传播整理发布。
【摘要】:随着云计算的快速发展及其在各领域的广泛应用,作为云计算的基础支撑,云存储成为该领域的一个研究热点。云存储技术负责将数据资源存储到云端的数据中心,并为用户提供访问服务功能。云存储系统具有可用性、可靠性、扩展性以及快速的数据访问等特点,而系统的这些特征都与数据副本的管理密切相关。现有的成果多从不同目标出发,例如考虑系统能耗或用户的服务质量等,研究了云存储环境下的数据布局优化方法。为满足用户需求,大多数的云服务选择运行在多个地理上分布(Geo-distributed)的数据中心。在geo-distributed云存储服务中,用户将数据备份到云存储端并且有选择性地与其他用户共享,数据资源的存储是主要的成本开销,而服务的最终目标是为用户提供较好的用户体验。考虑到用户的区域性分布及用户量的爆炸性增长,将数据备份到多个云端来减少访问数据时的传输时间,使用户获得更好的用户体验,是更有效的方法。然而,数据副本备份又会导致更高的存储花费,因此,在数据的存储开销和用户体验之间进行较好的权衡是云存储服务所面临的挑战。我们提出的数据副本放置策略,需要既能保证较少的存储开销的同时,又可以兼顾用户体验性能。近年来,移动互联网的便利性促进了移动用户数量的快速增加。更多用户经常会利用移动终端,随时随地备份数据到云存储中心,移动云存储的研究也逐渐被大家关注。而移动性也带来了新的挑战,例如,移动云存储服务的推广促进了用户之间对数据的相互访问,用户位置不固定影响了用户体验等。因此,系统放置数据时也需考虑云存储服务的移动性。用户作为云存储服务主体,要求系统在存储副本时还需考虑用户的优先级和活跃度等行为特征。如何应对移动互联网,考虑用户特性对数据副本放置的影响是亟待解决的问题。本文主要针对云存储服务的地理分布特性,结合用户行为特征,根据上述问题,做了以下工作:(1)在本文中,我们对geo-distributed云存储服务中的数据副本放置问题进行建模,主要从云存储服务提供商的角度出发,综合考虑了数据的存储开销和用户体验,而本文的用户体验性能是指用户访问数据的传输延迟。本文不仅考虑了云存储中心的地域分布性,而且详细分析了用户的访问特征。结合实际应用情况,用户会访问其他用户共享的文件,用户之间以文件为纽带建立了联系,基于此重点考虑了用户行为对数据存储的影响。(2)通过在存储开销和用户体验之间权衡,提出了数据放置的优化研究策略,设计了数据副本的调整算法(RPA),结合用户和云存储中心的特性,可将该算法用于定期优化系统的整体存储情况。(3)当用户要放置副本到云存储中心时,本文考虑了用户和数据中心,用户之间的通信对副本存储的影响,分析了geo-distributed云存储服务的社会感知特征。提出了基于社会感知的数据副本放置算法(DDRP),算法根据当前环境下的用户状态,及用户间的关系等信息动态地存储用户数据副本。根据该算法系统可以选择较优的数据中心集来放置数据副本。实验结果显示,算法RPA在不影响用户体验的同时,调整副本后减少存储开销约45%。与其他副本放置方法相比,本文提出的DDRP算法能够在降低存储开销的同时又保证较好的用户体验性能。与其他方法相比数据副本存储的整体开销减少约40%,验证了算法的有效性。
【关键词】:云存储服务 存储开销 用户体验 社会感知 副本放置
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP333
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-17
- 1.1 研究背景10-13
- 1.1.1. 云存储介绍10-12
- 1.1.2 分布式数据副本管理12-13
- 1.2 研究意义13-14
- 1.3 本文工作14-15
- 1.4 本文结构15-17
- 第2章 云存储环境下副本放置的相关研究17-21
- 2.1 分布式系统下的副本管理17-18
- 2.2 云计算环境下的副本放置18-20
- 2.2.1 相关工作18-19
- 2.2.2 云存储副本放置的新问题19-20
- 2.3 本章小结20-21
- 第3章 数据副本放置调整策略21-34
- 3.1 引言21-22
- 3.2 系统模型22-24
- 3.3 数据副本放置策略的优化目标24-26
- 3.4 用户特征分析26-30
- 3.4.1 用户的移动性26-28
- 3.4.2 用户的优先级28-30
- 3.5 副本放置的周期性调整30-32
- 3.5.1 优化目标30-31
- 3.5.2 副本放置调整算法31-32
- 3.6 本章小结32-34
- 第4章 基于社会感知的动态副本放置算法34-40
- 4.1 引言34
- 4.2 用户数据共享的影响34-36
- 4.3 数据副本的动态放置36-37
- 4.3.1 副本放置问题36
- 4.3.2 集合覆盖问题36-37
- 4.4 动态数据副本放置算法37-39
- 4.5 本章小结39-40
- 第5章 实验与结果分析40-49
- 5.1 实验设置40-42
- 5.1.1 实验环境40-41
- 5.1.2 对比算法41-42
- 5.1.3 测试指标42
- 5.2 数据副本调整测试42-45
- 5.2.1 不同权衡系数的影响42-43
- 5.2.2 不同数据中心规模测试43-45
- 5.2.3 不同用户规模测试45
- 5.3 动态副本放置算法测试45-48
- 5.3.1 不同放置策略的比较46-47
- 5.3.2 副本数量的变化47-48
- 5.4 本章小结48-49
- 第6章 总结与展望49-50
- 参考文献50-53
- 作者简介及在学期间科研成果53-54
- 致谢54
【参考文献】
中国期刊全文数据库 前3条
1 王艺文;苏森;谢琛甫;双锴;;跨数据中心的关联云数据部署策略[J];华中科技大学学报(自然科学版);2013年S2期
2 FU Xiong;ZHU Xin-xin;HAN Jing-yu;WANG Ru-chuan;;QoS-aware replica placement for data intensive applications[J];The Journal of China Universities of Posts and Telecommunications;2013年03期
3 孙大为;常桂然;高尚;靳立忠;王兴伟;;Modeling a Dynamic Data Replication Strategy to Increase System Availability in Cloud Computing Environments[J];Journal of Computer Science & Technology;2012年02期
中国硕士学位论文全文数据库 前1条
1 黄其华;多数据中心云存储环境下多副本管理策略的研究[D];厦门大学;2014年
本文关键词:Geo-distributed云存储服务中数据副本放置策略的研究,,由笔耕文化传播整理发布。
本文编号:334604
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/334604.html