E级超级计算机故障预测的数据采集方法
本文关键词:E级超级计算机故障预测的数据采集方法
更多相关文章: 超级计算机 故障预测 数据采集方法 数据汇集
【摘要】:面向未来E级超级计算机,提出用于故障预测的数据采集框架,能够全面采集与计算结点故障相关的状态数据。采用自适应多层分组数据汇集方法,有效解决随着系统规模增长数据汇集过程开销过大的问题。在TH-1A超级计算机上的实现和测试表明,该数据采集框架具有开销小、扩展性好的优点,能够满足未来大规模系统故障预测数据采集的需求。
【作者单位】: 国防科技大学计算机学院;国家超级计算天津中心;中国人民解放军95942部队;
【关键词】: 超级计算机 故障预测 数据采集方法 数据汇集
【基金】:国家自然科学基金资助项目(61272141,61120106005) 国家863计划资助项目(2012AA01A301)
【分类号】:TP306.3
【正文快照】: 超级计算机的飞速发展面临许多挑战,可靠性问题成为影响系统性能发展的重要挑战之一。未来E级超级计算机由数十万个部件组成,系统平均无故障时间(Mean Time Between Failure,MTBF)将从小时级到分钟级[1]。消息传递接口(Message Passing Interface,MPI)是超级计算机应用的主要
【相似文献】
中国期刊全文数据库 前10条
1 王斌;齐长远;李永平;;高分辨率电压与电流快速数据采集方法[J];电子测量技术;2002年01期
2 陈伟;Qiu Robin;;面向大型数据库的审计数据采集方法[J];计算机应用;2008年08期
3 王维瑞;范媛媛;孙伯川;;手持GPS设施农业数据采集方法与实践[J];农业网络信息;2011年12期
4 潘红平;;数字城管部件普查数据采集方法探讨[J];四川地质学报;2013年S1期
5 蒋建伟;到馆人数数据采集方法研究与实现[J];江苏图书馆学报;1994年04期
6 陈明兵;刘知贵;;用于网络流量异常检测的数据采集方法的研究[J];电脑知识与技术;2009年04期
7 王飞;司光亚;杨镜宇;;基于任务的体系对抗仿真数据采集方法研究[J];系统仿真学报;2011年05期
8 孙朝斌;石明华;马卫民;郭海生;;红外热像仪船用数据采集方法应用[J];舰船科学技术;2011年09期
9 孙朝斌;石明华;马卫民;郭海生;;红外热像仪舱室设备数据采集方法应用研究[J];测控技术;2011年10期
10 盖炳帅;王劲林;刘学;;一种业务关联的数据采集方法[J];西安电子科技大学学报;2013年02期
中国重要会议论文全文数据库 前3条
1 赵海滨;洪延姬;崔村燕;辛朝军;;重复加载脉冲推力测试数据采集方法[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
2 江宁川;李祥;赵U,
本文编号:873294
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/873294.html