多机集群心跳技术研究
发布时间:2020-03-19 05:46
【摘要】: 集群技术就是将多台服务器用集群软件连接在一起,组成一个高度透明的大型服务器群的计算机系统,作为一个整体为客户端提供服务,客户端能共享网络上的所有资源,如数据或应用软件等,同时客户端的用户并不关心其应用服务运行在那台服务器上,只关心其应用服务是否能连续工作。当集群系统内某一台服务器出现故障时,其备援服务器便立即接管该故障服务器的应用服务,继续为前端的用户提供服务。 对于任何一款集群产品,故障监视都是最核心的功能。监视资源种类的多少和监视层次的深浅,都成为评价一款集群软件高可用性的重要指标。此外,在集群系统中,服务器之间还需要定期进行相互间的健康状态检查,称之为心跳探测。心跳探测主要通过网络来进行,包括私网心跳和作为备份方式的公网心跳探测。一款优秀的集群软件应具有完备的心跳探测机制来避免在高负荷状态下心跳超时所导致的误切换。心跳在集群软件中担负着节点间信息通信,故障判断,事件触发等等重要作用,是集群软件最核心的组件。 所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。 敦阳泰克科技有限公司的RoseCluster集群系统,将多台服务器与磁盘阵列系统直接连接,用户的操作系统,应用软件和RoseCluster高可用软件安装在多台服务器上,数据库等共享数据存储在存储系统上,服务器之间通过私有心跳网络连接。通过心跳网络来判断服务器间是否需要进行切换,保证业务的连续性和数据的连续性。本文主要研究RoseCluster中心跳系统的设计与改善心跳传输技术以及研究心跳安全性,保证服务器节点探测的有效性,避免误切换,保证企业数据的持续性。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP338
本文编号:2589798
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP338
【引证文献】
相关硕士学位论文 前2条
1 王维高;基于KUSU的超大规模Linux集群系统的设计与实现[D];西北大学;2011年
2 肖永;集群化软件架构的研究与设计[D];西北大学;2013年
,本文编号:2589798
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2589798.html