基于日志分析的超级计算机错误预测方法研究
发布时间:2025-02-07 18:00
大量的错误严重影响了超级计算机系统的稳定性,错误预测对于提高其稳定性有重要作用,日志分析是进行错误预测的有效方法。建立了错误预测的基本框架,包括日志的预处理、基础预测器和联合预测器,其中基础预测器包括时间预测器和关联预测器。在BlueGene/L日志上进行的实验结果显示联合预测器的预测效果比基础预测器好。这表明错误预测要充分挖掘错误的特性,将基于各种错误特性的基础预测器联合起来进行预测才能取得满意的预测效果。
【文章页数】:3 页
【部分图文】:
本文编号:4031084
【文章页数】:3 页
【部分图文】:
图5时l田预1DP1器.关联预测R.0
进行关联预测,Tw的选取十分重要,而在实验过程中,发现Tw的选取对关联规则的影响不大,本着尽可能少地占用系统资源的原则,选取Tw=5min。另一方面,min<sub>s</sub>upport对关联规则的影响较大,故选择了多个min<sub>s</sub>upport....
图1错误预测框架
图2时问预测原理
Te]。图2描述了这一问题,图2中F表示一种错误,F1表示这种错误第一次发生,F2表示第二次发生,F3表示第三次发生,F4表示第四次发生。F1可以用来预测F2,但是这种预测没有任何意义,因为它们的间隔时间仅仅只有2s,可能是同一错误被记录多次;而F1可以用来预测....
图3关联顶溯J效果图
联合预测器的查全率低于时间预测和关联预测的查全率之和,如图5所示(图5中选取min<sub>s</sub>upport=12)。这主要是因为在进行联合预测时,存在既能进行时间预测也能进行关联预测的错误,而联合预测不可能两者同时选择,必然会舍弃其中一种。图5中....
本文编号:4031084
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4031084.html