当前位置:主页 > 科技论文 > 计算机论文 >

一种基于日志结合分析的集群系统失效预测方法

发布时间:2018-01-05 22:03

  本文关键词:一种基于日志结合分析的集群系统失效预测方法 出处:《高技术通讯》2016年06期  论文类型:期刊论文


  更多相关文章: 大规模集群系统 系统日志 作业日志 日志分析 失效预测


【摘要】:研究了大规模超级计算机群系统的失效预测。针对现有的单一分析系统日志的方法不仅需要复杂的分布式数据挖掘技术,而且失效预测的召回率普遍不高的问题,提出了一种通过将记载集群系统负载变化的作业日志同系统日志结合起来分析来进行失效预测的方法。该方法的原理如下:首先,通过对原始系统日志和作业日志进行预处理和过滤,分别得到细粒度的二维的事件序列和作业序列;然后从中抽取出在系统日志的失效事件发生前作业日志所表现出的三种典型失效征兆;最后,利用失效征兆进行失效预测。在真实的IBM Blue Gene/P系统的系统日志和作业日志上的实验结果表明,基于两种日志结合分析的方法能以较高的准确率和召回率实现细粒度的失效预测。
[Abstract]:Failure prediction large-scale super computer group system is studied. According to the analysis method of single log system requires not only the existing complex distributed data mining technology, and the recall rate of failure prediction is generally not high, the paper presents a method for failure prediction of the recorded cluster system load changes with the job log system log the combined analysis. The principle of the method is as follows: firstly, through preprocessing and filtering of the original system logs and logs are two-dimensional fine-grained event sequence and operation sequence; then extracted from three typical failure events in the system log before the job log shows signs of failure finally, the failure prediction; using the failure sign. In the system log log IBM Blue Gene/P system and work on the real experimental results show that the base Two methods of log combined analysis can achieve fine-grained failure prediction with higher accuracy and recall.

【作者单位】: 计算机体系结构国家重点实验室;中国科学院计算技术研究所;中国科学院研究生院;
【基金】:863计划(2015AA015308) 973计划(2014CB340402)资助项目
【分类号】:TP338
【正文快照】: 0引言大规模集群系统是云计算和高性能计算的常用平台。随着越来越多传统的社交和经济活动被搬到互联网上,数据中心的计算任务变得日益复杂,超级计算机也正朝着百亿亿次级(exascale)的规模发展,相应地,大规模集群系统的失效(failure)则成了大规模集群系统的常态[1]。可靠性与

【相似文献】

相关期刊论文 前4条

1 许波;檀润华;郭迪明;刘丽峰;;扩展的失效预测模板研究及其工程应用[J];机械设计;2013年10期

2 李刚;谢永成;李光升;程延伟;;改进型灰色模型在铅蓄电池失效预测中的应用[J];电子测量技术;2011年05期

3 张殿锋;闫相祯;;基于统计学习理论的山前构造带推覆带钻具失效预测[J];石油矿场机械;2012年08期

4 ;[J];;年期

相关会议论文 前2条

1 张玉芳;邓永容;;玻璃钢管的失效分析及失效预测技术[A];复合材料的现状与发展——第十一届全国复合材料学术会议论文集[C];2000年

2 偶国富;郑智剑;金浩哲;曹晶;黄军辉;谢浩平;杨波;;复杂特种设备系统流动腐蚀预测及工程应用[A];中国机械工程学会压力容器分会第七届压力容器及管道使用管理学术会议暨使用管理委员会七届二次会议论文集[C];2011年

相关硕士学位论文 前5条

1 张绍震;基于日志文件的在线系统失效预测[D];浙江理工大学;2016年

2 葛珊珊;新型钳制器设计与失效预测研究[D];华中科技大学;2014年

3 郑从环;在线软件系统的失效预测[D];浙江理工大学;2015年

4 王彩琴;卧辊磨主要构件的强度分析和失效预测[D];武汉理工大学;2007年

5 佟晓刚;汽车齿轮失效预测的可行性研究[D];哈尔滨理工大学;2006年



本文编号:1385008

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1385008.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7f2de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com