当前位置:主页 > 科技论文 > 计算机论文 >

分层检查点的近似最优周期计算模型

发布时间:2018-01-28 04:47

  本文关键词: 高性能计算 容错 分层检查点 检查点周期 近似最优解 出处:《计算机应用》2017年01期  论文类型:期刊论文


【摘要】:针对大规模高性能计算(HPC)系统中检查点效率提升问题,提出一种面向分层检查点近似最优周期计算模型。首先,通过分析一个HPC系统中应用程序的执行过程,将检查点周期优化抽象为一个非线性的检查点成本模型;其次,通过分析可能故障位置推导出分层检查点成本公式,并引入两个减速因子和一个加速因子来模拟消息日志对分层检查点造成的影响。仿真实验结果表明,所提模型与理论近似最优周期检查点成本平均误差在5%以下,相对传统检查点周期优化模型的平均误差降低了20%,能够有效提高检查点的效率,提升HPC系统可用性。
[Abstract]:Aiming at the problem of improving checkpoint efficiency in large scale high performance computing (HPC) systems, an approximate optimal period calculation model for layered checkpoint is proposed. By analyzing the execution process of an application program in a HPC system, the checkpointing cycle optimization is abstracted into a nonlinear checkpoint cost model. Secondly, the cost formula of hierarchical checkpoint is deduced by analyzing the possible fault location, and two deceleration factors and one acceleration factor are introduced to simulate the effect of message log on hierarchical checkpoint. The average cost error of the proposed model is below 5%, compared with the traditional checkpointing cycle optimization model, the average error is reduced by 20%, which can effectively improve the efficiency of checkpoint. Improve HPC system availability.
【作者单位】: 哈尔滨工程大学计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(61370212,61402127,61502118) 黑龙江省自然科学基金资助项目(F2015029)~~
【分类号】:TP38
【正文快照】: 0引言 随着大规模和超大规模集成电路的问世,高性能计算(High Performance Computation,HPC)系统进入高速发展期,根据International Exascale Software Project(IESP)的研究报告[1]显示,HPC系统及其相关技术会持续发展。然而在实际部署与运行中人们发现,系统的高复杂性、高异

【相似文献】

相关期刊论文 前10条

1 慈轶为;张展;左德承;吴智博;杨孝宗;;可扩展的多周期检查点设置[J];软件学报;2010年02期

2 蒋廷耀,李庆华;一种新的优化的检查点间隔的求解模型[J];小型微型计算机系统;2003年03期

3 梁蓓,张大方,杨金民,季洁;用时间序列分析方法动态确定检查点时间间隔[J];系统仿真学报;2004年10期

4 罗克露;向后滚动检查点技术在虚存中的应用[J];计算机应用;1996年05期

5 李凯原,杨孝宗;减少检查点开销的一种方法[J];计算机工程与应用;2000年02期

6 廖剑伟;李莉;陈善雄;余建桥;;实时交互进程的并发检查点技术[J];电子科技大学学报;2011年04期

7 李凯原,杨孝宗;提高用任务重复的检查点方案的性能[J];电子学报;2000年05期

8 田甜;祝永志;;一种改进的同步检查点设置算法[J];计算机技术与发展;2009年08期

9 罗元盛,闵应骅,张大方;一种基于索引的准同步检查点协议[J];计算机学报;2005年10期

10 罗元盛,闵应骅,张大方;基于索引的准同步检查点的重新计时策略[J];计算机工程与科学;2005年04期

相关会议论文 前5条

1 罗元盛;闵应骅;张大方;;基于索引的准同步检查点的重新计时策略[A];第三届中国测试学术会议论文集[C];2004年

2 陈海涛;韦中伟;卢宇彤;;一种检查点感知的文件恢复算法[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

3 黄敬尧;;分布式系统中检查点的设计及实现[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年

4 周军海;张大方;杨金民;;改进的快速N+1奇偶校验检查点[A];第三届中国测试学术会议论文集[C];2004年

5 王学慧;张磊;;高性能仿真中检查点设置研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年

相关重要报纸文章 前7条

1 本报记者 陆一波;趸船上建起安检“铁皮屋”[N];解放日报;2010年

2 本报记者 刘建 本报实习生 高原;为平安世博筑起安全滤网[N];法制日报;2010年

3 罗庆超;VxFS中的检查点和快照技术[N];中国计算机报;2007年

4 梁肃平;“三联合”执法成效显著[N];新乡日报;2005年

5 记者 刘长青;我市警方严厉打击交通违法行为[N];安阳日报;2006年

6 王伦华 一鸣;沙湾:爱心助残进农家[N];乐山日报;2006年

7 本报记者 叶佑平 本报通讯员 赵永军;公路治超法律环境亟需完善[N];山西日报;2004年

相关博士学位论文 前2条

1 徐振朋;移动计算环境下检查点回卷恢复容错技术研究[D];哈尔滨工程大学;2011年

2 赵国冬;嵌入式系统弹性应对方法研究[D];哈尔滨工程大学;2011年

相关硕士学位论文 前10条

1 范鹏飞;基于自治车联云环境下检查点服务器的选取方案的研究[D];内蒙古大学;2015年

2 王天喜;移动设备环境下功耗优化的容错策略设计与实现[D];武汉纺织大学;2015年

3 张苏超;基于面向方面技术的软件检查点及恢复技术研究[D];电子科技大学;2015年

4 王时兴;基于检查点优化的进程级容错系统设计与实现[D];西安电子科技大学;2014年

5 万强;基于Profile检查点的航天级软件加固机制[D];国防科学技术大学;2013年

6 王浩;基于自适应策略的MapReduce检查点技术的研究与优化[D];上海交通大学;2015年

7 林茵;基于马尔可夫决策过程的快件质量检查点研究[D];北京交通大学;2016年

8 王皓;基于异步检查点的动态软件升级系统[D];华中科技大学;2014年

9 迟文迪;基于链路稳定性的车联云检查点服务器选取方案的研究[D];内蒙古大学;2016年

10 谢争;基于检查点的进程级容错设计与研究[D];哈尔滨工程大学;2009年



本文编号:1469808

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1469808.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e0c58***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com