机群容错系统的设计与实现
发布时间:2020-03-31 14:30
【摘要】: 在高可用计算机的研究当中,如何保证系统的可用性和应用可靠性一直是需要首先考虑的问题。机群以其高性价比和高扩展性成为构造高性能计算机的一种主要方法,而节点间松散耦合的结构也使得机群系统更易于保证系统的性能。但是随着机群系统规模的增大,节点数目的增多,也带来了许多的问题。因此本系统以提高机群系统的可用性为目的,设计并实现了基于Linux的机群容错系统。系统由4个模块组成:用户模块、中心模块、进程模块和心跳模块。各个模块之间相互协作实现系统功能。本文对各个模块以及模块之间的关系进行了介绍。系统采用分布式的松散耦合体系结构来组织节点,使系统具有良好的可扩展性和更好的容错性。尽可能地避免因故障导致的停机和服务的中断。服务节点可以随时的加入或离开监控关系并且不会对服务造成影响。 本文设计为具有二级容错功能,利用机群系统普遍应用的心跳协议来实现节点间的检测。为了避免任务调度因素对检测的影响和完成对节点失效快速准确的检测,设计和实现了专用心跳检测协议。使其作为网络协议实体运行在操作系统核心态,使得检测器运行更加稳定,从而大大提高了检测速度。对于服务级别的检测采用进程事件连接器来主动的检测服务的行为变化。对于受监控的服务只有系统撤销对其的监控才可以看作正常退出,否则就会对其进行容错处理。对于容错,本文选择由分布式选举算法选出的代理节点保证失效节点上的服务得到有效处理,采用简单的服务迁移来保证服务的不间断性,从而提高系统的可用性。
【图文】:
系统硬件体系结构
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP302.8
【图文】:
系统硬件体系结构
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP302.8
【相似文献】
相关期刊论文 前10条
1 ;Wind River加强基于OpenSAF的高可用性系统开发[J];电子与电脑;2011年08期
2 ;Wind River加强基于OpenSAF的高可用性系统开发[J];工业控制计算机;2011年06期
3 ;APC希望成为中国的高可用性电源保护专家[J];电源世界;2002年03期
4 汪筱红;;高可用集群技术的研究与应用[J];电脑知识与技术;2011年20期
5 杨海朝;;阻止你的MySQL集群罢工——MySQL高可用性方案探讨[J];程序员;2010年11期
6 ;探求高可用性和高安全性的平衡之道[J];现代制造;2010年41期
7 范轶;康慕宁;张子龙;;基于高可用性集群系统的动态软件更新[J];计算机应用与软件;2011年07期
8 李伟平;魏明欣;李东风;;一种简单高可用的服务体系结构[J];信息安全与通信保密;2011年09期
9 李正荣;;电视台全台网的高可用性研究[J];现代电视技术;2011年07期
10 武丹;曾R挽,
本文编号:2609200
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2609200.html