基于非易失内存的高性能计算容错技术研究
本文关键词: 高性能计算 系统可靠性 容错 NVRAM 进程模型 算法容错 检查点技术 出处:《国防科学技术大学》2013年博士论文 论文类型:学位论文
【摘要】:近年来,高性能计算系统的性能迅猛增长,系统规模不断扩大,预计在2020年前后,高性能计算将跨入E级(1018Flops)计算时代。然而,随着系统规模的增大,高性能计算机的可靠性问题也日益突出,迫使高性能计算系统必须借助容错技术才能保证用户应用能够正确完成。然而,系统规模的增大在导致系统可靠性不断下降的同时,又会引起容错的开销又不断增长。基于现有的容错技术,研究表明当高性能计算跨入E级时,容错开销将会占用系统的全部运行时间,从而导致系统的有效利用率为“零”。因此,现有的容错技术将无法应对未来高性能计算面临的可靠性挑战,需要研究新的容错技术。 新兴的非易失内存(Non-Volatile Random-Access Memory,NVRAM)设备既具有DRAM的随机快速访问的特性,又具备磁盘的非易失性,而且功耗也非常低。近年来,NVRAM技术发展非常迅速,并有望到2015年后投入实用。届时,NVRAM或代替DRAM作为内存,或成为结合内存和磁盘特点的新的存储层次,或代替磁盘作为新的快速存储介质,这都将为容错技术提供新的机遇。因此,本文的研究重点就是如何利用NVRAM技术来设计高效的容错技术。针对NVRAM可能应用的存储层次,本文进行了以下几个方面的研究: 1.基于算法的容错技术 当NVRAM设备成为结合内存和磁盘特点的新的存储层次时,我们研究了基于算法的容错技术。基于算法的容错思想是通过对应用数据和恢复数据统一编码的方式来进行容错。但是,现有的算法容错都是针对和矩阵运算相关的算法设计的,无法应用于其它类型的算法。本文利用NVRAM的特性,提出了新型的算法容错思想,使算法容错能够应用于更多的算法类型。我们的方法通过保证算法循环的原子性执行,使应用能够在发生错误后从未完成的循环继续执行。为了验证我们方法的有效性,我们设计实现了容错Barnes-Hut算法和容错K-means算法,实验表明,相对原算法来说,我们的容错算法能够以低于10%的开销达到容错的目标。 2.容错进程模型 当NVRAM设备代替DRAM作为主存时,我们进行了容错进程模型的研究。在传统进程模型中,由于进程和操作系统紧耦合,即使进程运行在NVRAM中,系统重启也会破坏进程的数据,使进程也无法容错。针对这个问题,我们设计并实现了名为NV-process的容错进程模型,使进程能够在发生错误后,继续之前的状态执行,从而使进程天然具备容错的能力。NV-process通过独立的物理空间机制和自包含的进程管理机制,实现了进程和操作系统的松耦合,使进程能够独立于操作系统存在。而且,NV-process为进程提供了事务化的执行方式,使进程在执行过程中能够维护自身状态的一致性。最后,NV-process为进程提供了原地的启动方式,使进程能够快速恢复。测试结果表明,和传统进程模型相比,NV-process能够以很小的执行开销实现容错的功能。 3.任意粒度增量式检查点技术 当NVRAM作为快速存储介质时,我们研究了支持任意粒度的增量式检查点技术。增量式检查点技术的开销主要来源于脏数据的检测和保存。由于磁盘的带宽以及块访问特性的限制,增量式检查点大都以内存页(通常,1页包含4096字节)为粒度来检测脏数据。这样虽然减小了检测开销,但是会增加保存开销。本文通过测试发现每个应用程序内存页的数据在两次连续的检查点间隔中有很大一部分数据不会发生变化,这说明传统的以页为单位的增量式检查点每次都保存了很多重复数据。为了减小检查点技术的开销,我们利用NVRAM支持字节访问的特性,设计并实现了支持任意粒度的增量式检查点框架。在统计了应用程序访存行为的基础上,我们建立了有关检查点粒度和代价的模型。通过分析,,我们得出了最优的检查点粒度。测试结果表明,同样使用最优粒度的情况下,我们的方法可以显著减小增量式检查点的开销,加速比最高可以达到1.3倍。
[Abstract]:In recent years , the performance of high - performance computing systems has increased rapidly , and the scale of the system is expanding . It is expected that high - performance computing will cross into the E - class ( 1018Flops ) computing era before and after 2020 . However , with the increase of system scale , the reliability problem of high - performance computer is also increasing . Based on the existing fault - tolerant technology , the research shows that the fault - tolerant overhead will occupy the whole running time of the system , thus leading the system to have a valid utilization rate of " zero " . Therefore , the existing fault - tolerant technology will not be able to meet the reliability challenge facing the future high - performance computing , and the new fault - tolerant technique needs to be studied . The new non - volatile random - access memory ( NVRAM ) device has not only the characteristics of random fast access of DRAM , but also the non - volatile memory of the magnetic disk , and the power consumption is very low . In recent years , NVRAM technology has developed very quickly and is expected to be put into practical use after 2015 . In this paper , the research focus of this paper is how to use NVRAM technology to design efficient fault - tolerant technology . 1 . Algorithm - based Fault - tolerant Technology In order to verify the validity of our method , we design a novel fault - tolerant algorithm and a fault - tolerant K - means algorithm . The experimental results show that the fault - tolerant algorithm can achieve the goal of fault tolerance at less than 10 % . 2 . Fault - tolerant process model In the traditional process model , because the process and the operating system are tightly coupled , even if the process runs in NVRAM , the process can not fault tolerance even if the process runs in NVRAM . 3 . Incremental checkpointing technology with arbitrary granularity An incremental checkpoint technology that supports arbitrary granularity is studied when NVRAM is used as a fast storage medium . The overhead of incremental checkpointing technology is mainly derived from the detection and preservation of dirty data . In order to reduce the overhead of checkpointing technology , incremental checkpoints have been designed and implemented to support arbitrary granularity incremental checkpoints every time a memory page ( usually , 1 page contains 4096 bytes ) .
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP302.8
【共引文献】
相关期刊论文 前10条
1 李传佑;汪芸;;拜占庭环境下新成员加入容错组状态同步[J];东南大学学报(自然科学版);2010年01期
2 张薇;马建峰;王良民;郭渊博;;门限Byzantine quorum系统及其在分布式存储中的应用[J];电子学报;2008年02期
3 张晓霞;张凤登;陈悫;张大庆;;分布式WSN系统中的拜占庭故障算法研究[J];工业控制计算机;2014年01期
4 刘钢;周敬利;秦磊华;陈小平;;纠错码拜占庭容错Quorum中错误检测机制[J];计算机科学;2007年05期
5 鲍洋;卢正鼎;黄保华;李瑞轩;胡和平;路松峰;;适合P2P环境的动态多秘密共享方案[J];计算机科学;2010年09期
6 瓮佳佳;张敏情;董斌;;一种基于特权分级的quorum系统构造方案[J];计算机应用研究;2010年09期
7 穆帅;单书畅;邓仰东;王志华;;基于PCM的GPU存储系统设计与优化[J];计算机科学;2013年10期
8 陈柳;周伟;;拜占庭容错中的视图变更算法[J];计算机与现代化;2013年10期
9 陈柳;周伟;;基于拜占庭容错的前摄恢复算法[J];计算机与现代化;2013年12期
10 叶培顺;;非结构化P2P网络的一种改进搜索算法[J];计算机与现代化;2013年12期
相关会议论文 前1条
1 董斌;张敏情;张薇;杨晓元;;分层门限Byzantine Quorum系统构造方案[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
相关博士学位论文 前10条
1 富弘毅;OpenMP并行程序容错技术研究[D];国防科学技术大学;2010年
2 贾佳;异构并行计算机容错技术研究[D];国防科学技术大学;2011年
3 宋伟;面向事务存储系统的容错技术研究[D];国防科学技术大学;2011年
4 郭渊博;容忍入侵的理论与方法及其应用研究[D];西安电子科技大学;2005年
5 王超;可生存网络系统的理论与关键技术研究[D];西安电子科技大学;2006年
6 张伟超;移动自组网若干安全问题的研究[D];中国科学技术大学;2007年
7 王秀群;可实用的拜占庭容错系统理论研究[D];浙江大学;2007年
8 吴晶晶;PKI关键理论与应用技术研究[D];中国科学技术大学;2008年
9 张薇;信息存储系统可生存性理论与关键技术研究[D];西安电子科技大学;2008年
10 刘钢;分布式存储系统中基于纠错码的容错机制研究[D];华中科技大学;2007年
相关硕士学位论文 前10条
1 申小飞;基于CPK的网上银行安全交易认证系统的研究[D];华中科技大学;2011年
2 曹则新;云存储中开放网络资源稳定存储机制的研究与实现[D];华中科技大学;2011年
3 杨坤;基于Hadoop的云存储系统客户端的设计与实现[D];华中科技大学;2011年
4 杨帆;基于P2P的分布式容错数字签名系统研究及应用[D];中国科学院研究生院(计算技术研究所);2006年
5 秦海波;容侵机制的应用与定量分析[D];吉林大学;2008年
6 王稼香;拜占庭容错算法在Web Services服务提供上的研究与应用[D];山东大学;2009年
7 秦榕;应用于金融服务系统的智能卡密码验证算法研究[D];苏州大学;2009年
8 琚巍巍;分布式存储系统容错技术的研究与实现[D];西安电子科技大学;2009年
9 徐兰钰;路基路面质量评定系统的开发与应用研究[D];东北林业大学;2010年
10 胡玲龙;无线传感器网络中基于节点行为分类的恶意节点检测[D];中国计量学院;2013年
本文编号:1496231
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1496231.html