机群监控系统关键技术的研究与实现
发布时间:2025-03-15 00:25
目前,高性能超级计算机的趋势已从高端的大型高性能计算机向计算机机群发展,促进了机群这一计算技术得到飞速发展。随着机群技术的广泛应用,机群系统的性能和可用性需要也在不断提高,但是机群系统结构松散、节点独立性强、网络连接复杂、故障难以维护。为了解决以上存在的问题,采用在节点机的操作系统上建立一层机群监控系统,它是大规模机群系统中一个非常重要的基础设施,机群监控系统的基本任务是获得机群当前的配置情况,监控机群的健康状况和性能指标,并提供机群系统故障诊断功能。 国内外机群监控系统虽具有良好的性能和可用性,但仍存在一些不足:1)机群监控系统在进行信息采集时用户不能及时获取所需的数据信息,会引入较大的系统开销,从而对机群系统产生负载影响。2)当监控节点发生故障时,无法实现故障节点的自动转移和恢复,造成监控数据传输失效,降低机群监控系统可靠性。 本文的主要研究内容及创新之处:(1)通过对监控信息采集技术的详细分析,采用IEEE1394协议和Ganglia机群监控技术相结合,设计实现了一种新型的机群监控信息采集模型,该模型不仅降低了机群监控系统对机群系统产生的负载,而且有效地提高了监控信...
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
本文编号:4034857
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
图2.5机群监控系统的运行环境
架构的三层通信模型,机群中各被监控机属于服务器端,并有几台指定的计算机作为中间代理,另外一台计算机作为客户端,也就是监控机,下文为表达清晰,统一称为被监控机、中间代理和监控机。机群监控系统的运行环境如图2.5所示。lllllllllllllll曰曰....
图4.3离散数据的分段直线拟合
算法4.1中“按逻辑时间点保存斜率”是指把逻辑时间为t时所对应拟合所得直线的斜率放入数组。[t1。表4.2中的数据经算法4.1处理,可得如下图4.3所示的分段拟合直线。得到四条分段直线的斜率依次为kl、h、场和杨,它们的值依次为0.41、一0.25、0.0474和一0.0309,....
图2.1C/S架构的两层通信模型
图2.1C/S架构的两层通信模型Fig.2.1C/Sarchitecturemodeloftwo-layercommunicationmodel模型涉及两种通信协议:拉模式和推模式。拉模式即Request/Response(请求式的通信协议,是指客户端在需....
图2.2C/M/S架构的三层通信模型
图2.2C/M/S架构的三层通信模型Fig.2.2C/M/Sarchitectureofthree-layercommunicationmodel型采用Request/Response模式通信协议有同步和异步方式,下面对两种和评价:(1)同步通信协议:在客....
本文编号:4034857
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4034857.html