当前位置:主页 > 科技论文 > 计算机论文 >

OpenMP并行程序容错技术研究

发布时间:2020-06-07 14:48
【摘要】:目前,高性能计算机系统的规模已经达到空前的水平,与此同时,系统的平均无故障时间却显著降低,可靠性问题日益严重。因此,必须采用适当的容错技术,使高性能计算应用能够容忍系统故障所引发的程序执行错误。 一段时期以来,由于共享存储体系结构在可扩展性方面存在局限性,应用范围不太广泛,因此针对这种体系结构的容错技术研究相对比较缺乏。近年来,随着多核处理器体系结构在高性能计算领域的应用日益广泛,越来越多的高性能计算系统开始利用多核处理器进行构建,并且出现了以SMP系统作为结点的MPP系统,因此针对共享存储体系结构的容错技术研究具有重要意义。 OpenMP是面向共享存储体系结构的主流的并行编程模型,本文面向OpenMP应用级容错技术,围绕基于回滚-恢复的容错机制展开研究,主要贡献在下列几点: 1.提出程序执行过程中硬件故障所引起的错误在程序中的传播模型,建立错误传播图及相关概念和分析方法,归纳错误传播的性质与结论,为面向OpenMP的容错机制设计提供理论指导。 2.提出一种面向OpenMP程序的应用级非阻塞式检查点机制,该机制以一种扩展的OpenMP并行数据流分析方法为基础,选择必需的变量保存到检查点映像,以降低计算状态保存的开销。 3.提出一种面向OpenMP程序的并行复算容错机制PR-OMP,由于程序的执行过程中错误往往仅可能发生在一个或两个线程上,所以可以利用未发生错误的线程并行地计算因错误而丢失的计算任务,从而降低错误恢复的开销。 4.提出一种面向OpenMP程序的冗余计算容错机制TriThread,使用多个冗余的计算副本同时执行一个OpenMP程序,并在执行过程中的某些时机上对中间的计算结果进行比较和投票,从而在无需计算状态保存的前提下达到容错的目标。与检查点机制和并行复算机制相比,基于冗余计算的容错方法虽然引入更多的空间开销,但在可扩展性方面具有相当的优势,是检查点技术和并行复算机制在可扩展性受限时的替代容错方案。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP338.6

【相似文献】

相关期刊论文 前10条

1 赵辉;徐俊刚;;基于OpenMP多核架构下并行蚁群算法研究[J];微型机与应用;2011年16期

2 王义强;袁修华;马明阳;胡艳娟;;基于神经网络的数控插补容错技术[J];农业机械学报;2011年07期

3 刘向娇;吴素萍;刘佳梅;;基于OPENMP求解旅行商问题的并行蚁群算法[J];微电子学与计算机;2011年07期

4 赵辉;钱文光;杨丽娟;;OpenMP中负载平衡优化的分析与研究[J];福建电脑;2011年06期

5 欧阳城添;王曦;郑剑;;自适应一致表决算法[J];计算机科学;2011年07期

6 王竹荣;巨涛;马凡;;多核集群系统下的混合并行遗传算法研究[J];计算机科学;2011年07期

7 宁新建;;航空火控计算机的容错技术分析[J];计算机与网络;2010年17期

8 赵军;吴建平;宋君强;辜旭赞;;多核环境下AREM模式混合并行计算研究[J];计算机工程与应用;2011年21期

9 路立伟;王亮;梁勇;范荣双;;模拟退火算法在频率指配中的应用优化[J];计算机技术与发展;2011年07期

10 张林;笪良龙;范培勤;;基于MPI+OpenMP混合编程模型的水声传播并行算法[J];微电子学与计算机;2011年08期

相关会议论文 前10条

1 李卫东;;容错技术在梅钢的应用[A];全国冶金自动化信息网2012年年会论文集[C];2012年

2 宋克庆;黄春;;基于OpenMP快速傅里叶变换并行实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年

3 王庆;季振洲;刘涛;;面向嵌入式多核存储层次的OpenMP优化研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

4 莫锦军;刘立国;袁乃昌;;基于OpenMP的并行GRECO软件[A];2011年全国微波毫米波会议论文集(下册)[C];2011年

5 蒙建波;吴银成;杨俊永;;容错技术与仪表的发展[A];第三次全国会员代表大会暨学术会议论文集[C];2002年

6 何涛;李爱波;黄渊;;基于OpenMP多线程技术的SAR地面处理软件的并行设计[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年

7 昌月楼;杨利;阳国贵;;SN-PDB中一种先进的结点容错法[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年

8 于洪涛;黄文轩;王和;;一种双机容错方案及其应用[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年

9 孟念青;Jason Wang;;Hybrid LS-DYNA汶新特色介绍[A];第七届中国CAE工程分析技术年会暨2011全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2011年

10 张伟;陈晓非;;并行计算在计算理论地震图中的应用——应用MPI/OpenMP在SMP-cluster机群采用三维有限差分计算地震图[A];中国地球物理学会第二十届年会论文集[C];2004年

相关重要报纸文章 前10条

1 艾先;容错技术扫描[N];中国贸易报;2004年

2 ;容错技术的发展与应用展望[N];计算机世界;2001年

3 ;容错技术应用前景[N];中国高新技术产业导报;2004年

4 孔令男;容错技术高端商用领域的核心[N];中国国门时报;2004年

5 胡志敏;“双核”容错服务器来了[N];政府采购信息报;2007年

6 ;无时间损失的容错技术[N];中国计算机报;2003年

7 ;容错技术成为服务器市场的黑马[N];中国国门时报;2004年

8 刘雨;让容错服务器“平民化”[N];中国计算机报;2007年

9 边月;容错技术带来的高可用[N];计算机世界;2003年

10 清华大学 郑纬民 陈文光;开发环境—搭建应用的基础[N];计算机世界;2003年

相关博士学位论文 前10条

1 富弘毅;OpenMP并行程序容错技术研究[D];国防科学技术大学;2010年

2 马红途;OpenMP程序分析及优化技术研究[D];解放军信息工程大学;2009年

3 陈永健;OpenMP编译与优化技术研究[D];清华大学;2004年

4 郭惠芳;面向多核的并行模式及编译优化技术研究[D];解放军信息工程大学;2011年

5 钱华明;故障诊断与容错技术及其在组合导航系统中的应用研究[D];哈尔滨工程大学;2004年

6 杨金民;低开销的回卷恢复容错技术研究[D];湖南大学;2005年

7 陈阿莲;新型多电平逆变器组合拓扑结构和多电平逆变器的容错技术[D];浙江大学;2005年

8 柳林;面向3G的H.264/AVC压缩视频通信技术研究[D];浙江大学;2006年

9 黄海林;高可靠处理器体系结构研究[D];中国科学院研究生院(计算技术研究所);2006年

10 卢鸿谦;SINS/GPS组合导航性能增强技术研究[D];哈尔滨工业大学;2006年

相关硕士学位论文 前10条

1 黄德君;机会网络中容错传输机制的研究[D];湖南大学;2010年

2 杨琳峰;容错加固计算机的设计与实现[D];天津大学;2003年

3 肖毅;网络考试系统安全及容错处理的研究与实现[D];中南大学;2009年

4 齐志华;车站信号电子执表系统研究[D];北京交通大学;2006年

5 杨林芳;无人机容错飞行控制系统研究[D];南京航空航天大学;2007年

6 周晴岚;基于多Agent的实时数据库故障排除技术[D];华中科技大学;2007年

7 焦亮;基于Linux内核的进程检查点技术研究[D];哈尔滨工程大学;2009年

8 严传龙;组合导航系统可靠性分析与研究[D];哈尔滨工程大学;2008年

9 张华健;基于集群系统状态的检查点技术的研究[D];哈尔滨工程大学;2008年

10 蔡常群;基于DSP的变压器保护监控系统的研究与设计[D];湖南大学;2004年



本文编号:2701578

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2701578.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc603***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com