高可用集群系统关键技术的研究与实现
发布时间:2017-07-08 15:24
本文关键词:高可用集群系统关键技术的研究与实现
更多相关文章: 集群 高可用 容错 任务分配 心跳检测 负载均衡
【摘要】:目前,计算机系统已全面进入“云计算”、“大数据”时代,由大规模服务器集群响应海量请求和处理海量数据已经成为必然趋势。但是仅仅具有高性能计算能力的集群系统还远远不能满足这种大规模应用的需要,它必须还能够提供连续的服务。所以如何提高集群系统的可用性,尽最大可能避免因系统失效而导致的严重后果,,并设计可扩展的高可用集群系统,已经成为当前集群系统研究的热点问题之一。 本文对高可用集群系统进行了研究,设计了一个高可用集群系统的框架,并对高可用集群系统的两个重要问题:容错机制和任务分配与迁移机制进行了深入研究。针对目前心跳检测算法普遍将心跳包的超时时间阈值设定为固定值而导致误判的问题,本文提出了一个基于ARMA预测的双层心跳检测算法,该算法采用ARMA方法预测心跳包的到达时间间隔,动态设置心跳包的超时时间,从而减少对节点状态的误判;针对目前负载均衡分配算法未考虑任务与资源的相关度问题,本文提出一个资源相关度关键的负载均衡分配算法,该算法充分考虑任务与各节点资源的相关度,能够在保证系统负载均衡的前提下,尽可能地将任务分配给与其相关度高的资源运行。 论文将提出的心跳检测算法应用于容错机制中,负载均衡算法应用于任务分配机制中,并初步实现了高可用集群核心部分的原型系统。对所实现的系统进行了性能测试实验,对实验数据的分析表明:系统具有故障检测正确率高、可用性高、负载均衡性能优秀以及任务等待时间短等优点。
【关键词】:集群 高可用 容错 任务分配 心跳检测 负载均衡
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP302.8
【目录】:
- 摘要4-5
- ABSTRACT5-6
- 目录6-9
- 图表清单9-11
- 注释表11-12
- 缩略词12-13
- 第一章 绪论13-19
- 1.1 概述13-14
- 1.2 国内外相关研究工作14-16
- 1.3 论文主要工作16-17
- 1.4 论文组织结构17-19
- 第二章 集群相关理论与技术19-31
- 2.1 集群系统概念与结构19-24
- 2.1.1 集群概念与分类19-20
- 2.1.2 典型集群模型与结构20-23
- 2.1.3 高可用集群技术23-24
- 2.2 高可用集群系统需求分析24-25
- 2.3 高可用集群系统的容错机制25-28
- 2.3.1 容错概念25-26
- 2.3.2 容错相关技术26-27
- 2.3.3 容错机制的实现方法27-28
- 2.4 高可用集群系统的任务分配机制28-29
- 2.4.1 任务分配的目标28
- 2.4.2 任务分配算法的分类28-29
- 2.5 高可用集群系统框架设计29-31
- 第三章 容错机制设计31-44
- 3.1 容错机制结构设计31-32
- 3.2 心跳技术及常用实现方法32-35
- 3.2.1 心跳技术32-33
- 3.2.2 心跳技术的常用实现方式33-35
- 3.3 基于 ARMA 预测的集群双层心跳检测算法35-44
- 3.3.1 DLHB 算法模型35-36
- 3.3.2 基于 ARMA 的心跳包到达时间预测算法36-38
- 3.3.3 域间主控节点心跳检测算法38-39
- 3.3.4 域内节点心跳检测算法39-41
- 3.3.5 仿真实验及性能分析41-44
- 第四章 任务分配与迁移机制设计44-65
- 4.1 任务分配机制设计44-45
- 4.2 集群负载均衡算法45-51
- 4.2.1 节点负载评价45-48
- 4.2.2 负载均衡算法48-50
- 4.2.3 现有算法分析50-51
- 4.3 一种资源相关度关键的负载均衡算法51-61
- 4.3.1 资源相关度关键的负载均衡模型51-53
- 4.3.2 负载信息计算53-54
- 4.3.3 资源组间优先级调度策略54-56
- 4.3.4 资源组内负载均衡调度策略56-58
- 4.3.5 仿真实验及性能分析58-61
- 4.4 任务迁移机制设计61-65
- 4.4.1 任务迁移机制模块结构61-62
- 4.4.2 任务迁移流程设计62-63
- 4.4.3 任务的备份与恢复63-65
- 第五章 高可用集群系统的实现及性能分析65-75
- 5.1 系统实现65-70
- 5.1.1 通信机制的实现67-68
- 5.1.2 容错机制的实现68-69
- 5.1.3 任务分配机制的实现69-70
- 5.1.4 任务迁移机制的实现70
- 5.2 系统性能测试与分析70-75
- 5.2.1 系统高可用性测试与分析71-72
- 5.2.2 任务分配性能测试与分析72-74
- 5.2.3 任务迁移性能测试与分析74-75
- 第六章 总结与展望75-76
- 6.1 结论75
- 6.2 后期研究工作75-76
- 参考文献76-82
- 致谢82-83
- 在学期间的研究成果及发表的学术论文83
【参考文献】
中国期刊全文数据库 前10条
1 孟相武,程劲,罗克露,韩淙;基于Linux的高可用集群系统的设计及实现[J];电子科技大学学报;2005年04期
2 邹柏贤,刘强;基于ARMA模型的网络流量预测[J];计算机研究与发展;2002年12期
3 王霜,修保新,肖卫东;Web服务器集群的负载均衡算法研究[J];计算机工程与应用;2004年25期
4 来晓;冯冬芹;褚健;;分布式网络故障检测及恢复技术研究[J];计算机工程与应用;2010年24期
5 张小芳,胡正国,郑继川,唐焱;高可用性集群技术的研究和应用[J];计算机工程;2003年04期
6 姚耀文,唐华松;Linux群集任务分配算法的探讨[J];计算机工程;2003年08期
7 罗娟,曹阳,郑刚,张俊新;高可用性软件的设计与实现[J];计算机工程;2004年08期
8 胡志刚;阎朝坤;刘长庚;;基于平均等待时间约束的松弛预留机制[J];计算机工程;2012年10期
9 刘健,徐磊,张维明;基于动态反馈的负载均衡算法[J];计算机工程与科学;2003年05期
10 杨磊;黄浩;李仁发;李肯立;;P2P存储系统拜占庭容错机制研究[J];计算机应用研究;2009年01期
本文编号:535168
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/535168.html