当前位置:主页 > 科技论文 > 计算机论文 >

云环境下MapReduce多组容错机制的研究

发布时间:2017-09-09 19:37

  本文关键词:云环境下MapReduce多组容错机制的研究


  更多相关文章: 云计算 MapReduce并行编程模型 多组容错机制


【摘要】:随着互联网技术的快速发展与普及,人类社会已由信息时代进入了大数据时代,传统的计算模式已经不能满足时代的要求,一种新兴的商业计算模型——云计算应运而生,云计算为计算机行业带来了新的机遇和挑战。云计算是一个大规模的分布式计算系统,为互联网上的外部用户提供抽象的、虚拟的、动态调整以及可管理的计算能力、存储、平台以及服务。云计算最典型的案例是Goolge公司提出的MapReduce并行编程模型,它简单易用、并行化程度高、可靠性高等特点吸引了很多用户。目前,国内外针对MapReduce编程模型各个方面的研究很多,其中关于MapReduce容错机制一直是研究热点之一。针对容错机制的研究可以总结为两种方案:备份和再执行,但是这两种方案有一个基本前提条件——感知到失效节点,如果感知失效情况不及时或者不准确,这两种方案也就不能发挥作用了。本文将从一个新的视角出发,针对如何更快更准确的发现失效节点问题展开研究,主要分为以下几个方面:首先,根据需求分析设计容错方案,简单地将其分为三个步骤:多组监测、请求申请、任务迁移,分析各自的职能,研究多组容错的运行机制。其二,对传统的MapReduce架构进行改进,在同机柜中的各个TaskTracker节点之间搭建多组架构,建立多组心跳机制,分别在TaskTracker和JobTracker上增加多组类multipleTaskTracker、multipleJobTracker,实现多组容错。其三,对任务迁移过程中可能出现的资源竞争问题进行补充,根据公平性原则,针对两类资源竞争现象按照各自的规则进行任务迁移。最后,分别从响应时间、加速比和多组容错的优势三个方面对多组容错性能进行分析,得出在不影响系统扩展性的前提下,多组关系提高了监测失效节点的效率,节约了作业响应时间,降低了带宽使用率,减少网络拥塞,减轻了JobTracker节点的负荷。大量实验数据表明,在不影响MapReduce系统可扩展性的前提下,多组容错要明显优于传统容错方案。在集群中存在失效节点时,多组容错可以将发现失效的时间大幅度地缩短,并且可以游刃有余的解决任务迁移过程中的资源竞争现象。
【关键词】:云计算 MapReduce并行编程模型 多组容错机制
【学位授予单位】:河南理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP302.8
【目录】:
  • 致谢4-5
  • 摘要5-6
  • Abstract6-11
  • 1 引言11-17
  • 1.1 研究背景和意义11-12
  • 1.2 国内外研究现状12-14
  • 1.3 本文工作14-16
  • 1.3.1 研究内容14-15
  • 1.3.2 研究重点和难点15-16
  • 1.4 论文的组织结构16-17
  • 2 云计算中MapReduce编程模型的分析17-33
  • 2.1 云计算概述17-20
  • 2.2 Hadoop计算平台20-24
  • 2.2.1 Hadoop开源架构21
  • 2.2.2 HDFS文件系统21-22
  • 2.2.3 MapReduce架构22-24
  • 2.3 MapReduce编程模型24-29
  • 2.3.1 MapReduce概述24
  • 2.3.2 MapReduce编程思想24-26
  • 2.3.3 MapReduce主从架构26
  • 2.3.4 MapReduce实现流程26-28
  • 2.3.5 MapReduce研究热点28-29
  • 2.4 MapReduce容错相关改进29-31
  • 2.4.1 慢任务评判算法29-30
  • 2.4.2 中间值存储方案30
  • 2.4.3 单控制节点容错方案30-31
  • 2.5 本章小结31-33
  • 3 MapReduce容错机制分析33-47
  • 3.1 容错实体类33-37
  • 3.1.1 JobTracker类33-34
  • 3.1.2 TaskTracker类34-35
  • 3.1.3 Storage相关类35-36
  • 3.1.4 HeartbeatResponse相关类36-37
  • 3.2 MapReduce容错策略37-43
  • 3.2.1 备份方案37-39
  • 3.2.2 失效监测机制39-42
  • 3.2.3 推测执行机制42-43
  • 3.3 容错性能评估指标43-45
  • 3.3.1 响应时间43-44
  • 3.3.2 加速比44
  • 3.3.3 可靠性44
  • 3.3.4 公平性44-45
  • 3.4 本章小结45-47
  • 4 MapReduce多组容错机制的研究47-57
  • 4.1 需求分析47
  • 4.2 实现方案47-50
  • 4.2.1 多组监测48
  • 4.2.2 请求申请48-49
  • 4.2.3 任务迁移49-50
  • 4.3 多组容错机制的研究50-54
  • 4.3.1 多组机制实现类50-51
  • 4.3.2 搭建多组架构51-53
  • 4.3.3 多组心跳机制53-54
  • 4.4 多组关系带来的资源竞争54-55
  • 4.5 性能分析55-56
  • 4.5.1 响应时间分析55
  • 4.5.2 加速比分析55
  • 4.5.3 优势分析55-56
  • 4.6 本章小结56-57
  • 5 实验与结果分析57-67
  • 5.1 实验环境配置57-60
  • 5.1.1 集群配置方案57-58
  • 5.1.2 SSH和JDK的配置58
  • 5.1.3 Hadoop的安装配置58-60
  • 5.2 基准测试60-62
  • 5.3 实验结果与分析62-66
  • 5.3.1 响应时间对比分析62-63
  • 5.3.2 公平性测试63-64
  • 5.3.3 加速比性能测试64-66
  • 5.4 本章小结66-67
  • 6 总结与展望67-69
  • 6.1 工作总结67-68
  • 6.2 展望68-69
  • 参考文献69-73
  • 作者简介73-75
  • 学位论文数据集75

【相似文献】

中国期刊全文数据库 前10条

1 费秀婷,沈庆浩;移动agent系统的容错机制[J];计算机与数字工程;2005年04期

2 么刚;王劲林;姚琼;朱小勇;孙鹏;;嵌入式高清播放器容错机制的研究与实现[J];计算机系统应用;2009年01期

3 刘添添;移动Agent系统的一种安全容错机制[J];计算机工程;2005年18期

4 聂瑞华;张科伦;梁军;;一种改进的云存储系统容错机制[J];计算机应用研究;2013年12期

5 陈波;张曦煌;;基于分层与容错机制的云计算负载均衡策略[J];计算机应用;2013年11期

6 孙峻朝,王建莹,杨孝宗;故障和容错机制的层次模型[J];计算机工程与应用;1999年10期

7 姜楠;李战怀;任X;胡金鹏;;远程镜像系统容错机制的研究与实现[J];计算机工程;2011年01期

8 张大为,韩华,代亚非;P2P系统中降低错误相关性的方法[J];计算机研究与发展;2005年08期

9 赖巍;郭荷清;朱娟;;基于补偿服务链的Web服务容错机制研究与实现[J];计算机应用与软件;2009年01期

10 张治斌;李燕歌;;云计算下MapReduce多组容错机制架构的分析与研究[J];微电子学与计算机;2014年01期

中国重要会议论文全文数据库 前2条

1 万国伟;谢e,

本文编号:822383


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/822383.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dcc99***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com