当前位置:主页 > 科技论文 > 计算机论文 >

基于集群系统状态的检查点技术的研究

发布时间:2020-04-09 20:27
【摘要】: 随着当今社会的发展,各种应用领域对计算能力的要求越来越高,集群作为一种有效可扩展的并行计算的形式得到了广泛的应用。很多集群系统被应用在国计民生的重要领域,集群的规模也在不断扩展。随着集群系统规模的扩展,其出现故障的几率也成指数级增长,所以,集群系统的容错性能成了衡量集群性能的重要指标。检查点设置卷回恢复技术作为一种并行系统中有效的容错方式,在目前的集群系统中得到广泛的应用。 本文系统地介绍了集群系统的概念及容错的相关技术,着重介绍了检查点设置卷回恢复技术。分析了当前国内外常见的减少检查点开销的方法。除了用户参与法和编译器辅助内存排除法是真正的减少了检查点的文件大小,从本质上减小了检查点需要保存的进程运行状态。其它方法都是在实际需要保存进程运行状态一定的情况下,从不同侧面减小需要保存的文件大小或者提高检查点和程序的并行性来减少检查点卷回恢复的开销。文章中提出了通过监控系统的当前状态来设置检查点的方法,即在系统状态小的时刻进行设置检查点操作,这样能从根本上减少检查点文件的大小,并克服了原有算法破坏检查点操作透明性的缺点,实验证明这种方法能有效减少检查点开销。 文章详细地介绍了基于监控系统状态的设置检查点方法,以及在基于PVM和Linux的集群系统上的实现。由于用户进程在PVM上的运行特点,使得保存检查点工作分别要保存用户进程作为操作系统普通进程的状态和作为PVM任务的状态。系统中采用在设置检查点时刻先退出PVM,再重新加入PVM的方式实现检查点的保存。
【图文】:

示意图,无共享结构,示意图,中间件


无共享结构集群示意图

示意图,结构集,示意图,集群系统


的文件系统,提供给整个集群一个巨大的储存设备。尤其在一些高可用的场合,共享磁盘阵列常常能够解决文件系统容错和数据一致等可靠性问题。分布式文件系统正是这类体系结构的应用体现。这种类型的体系结构如图2.2所示:厂.1,, 1.|1卜训州11吐~‘~‘~‘石奋奋百誉益Jl‘~…,石百二舀石孟J图2.2共享磁盘结构集群示意图(3)共享存储器结构这种体系结构的集群系统不但共享外部存储设备,而且还共享内存,具有很大的复杂性,但是,这种体系结构的集群系统具有最好的单一系统映像(551)能力。其体系结构如图2.3所示:
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP338.6

【相似文献】

相关期刊论文 前10条

1 杨艳妮;彭道勇;张仕念;殷维刚;张国彬;;军用软件可靠性问题研究[J];电子产品可靠性与环境试验;2009年S1期

2 王义强;袁修华;马明阳;胡艳娟;;基于神经网络的数控插补容错技术[J];农业机械学报;2011年07期

3 欧阳城添;王曦;郑剑;;自适应一致表决算法[J];计算机科学;2011年07期

4 范轶;康慕宁;张子龙;;基于高可用性集群系统的动态软件更新[J];计算机应用与软件;2011年07期

5 尹辉燕;郭伟华;石健;王少萍;;容错网络服务器系统可用性[J];计算机应用与软件;2011年09期

6 张艳;唐宏;李忠;赵冬梅;;TD-SCDMA集群系统中的干扰分析[J];数字通信世界;2011年06期

7 宁新建;;航空火控计算机的容错技术分析[J];计算机与网络;2010年17期

8 薛娟;苏厚勤;;并行处理技术在ETL计算环境中的应用研究[J];计算机应用与软件;2011年08期

9 高水娟;;Linux集群服务[J];软件导刊;2011年07期

10 何立群;;数据库集群系统负载均衡技术的应用[J];煤炭技术;2011年08期

相关会议论文 前10条

1 李卫东;;容错技术在梅钢的应用[A];全国冶金自动化信息网2012年年会论文集[C];2012年

2 蒙建波;吴银成;杨俊永;;容错技术与仪表的发展[A];第三次全国会员代表大会暨学术会议论文集[C];2002年

3 王坚;;基于UNIX的集群系统的比较[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

4 王长生;;重庆集群移动通信的发展对策与展望[A];四川省通信学会一九九三年学术年会论文集[C];1993年

5 白玎玲;王文春;朱煜;;浅谈高性能集群系统的管理与应用[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年

6 黄福明;;容错技术在宝钢过程控制系统的应用[A];中国计量协会冶金分会2009年年会论文集[C];2009年

7 昌月楼;杨利;阳国贵;;SN-PDB中一种先进的结点容错法[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年

8 孙建林;葛晓;盛磊;余金鹏;张涛;;高可靠性容错服务器在实时控制系统中的应用[A];第十一届全国自动化应用技术学术交流会论文集[C];2006年

9 于洪涛;黄文轩;王和;;一种双机容错方案及其应用[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年

10 杨艳妮;彭道勇;张仕念;殷维刚;张国彬;;军用软件可靠性问题研究[A];2009第十三届全国可靠性物理学术讨论会论文集[C];2009年

相关重要报纸文章 前10条

1 胡志敏;“双核”容错服务器来了[N];政府采购信息报;2007年

2 艾先;容错技术扫描[N];中国贸易报;2004年

3 ;容错技术的发展与应用展望[N];计算机世界;2001年

4 ;容错技术应用前景[N];中国高新技术产业导报;2004年

5 边月;容错技术带来的高可用[N];计算机世界;2003年

6 孔令男;容错技术高端商用领域的核心[N];中国国门时报;2004年

7 朱方平;SPN—09集群系统新技术[N];通信产业报;2001年

8 中国海洋研究中心 张宏;优秀集群系统应具备怎样的条件[N];科技日报;2001年

9 ;低成本集群系统的强音[N];网络世界;2005年

10 胡;掌中无限低成本IP集群[N];计算机世界;2006年

相关博士学位论文 前10条

1 卓居超;时移电视集群系统缓存调度研究[D];中国科学技术大学;2010年

2 唐渊;大规模集群系统的性能评价与通信优化研究[D];中国科学院研究生院(软件研究所);2004年

3 钱华明;故障诊断与容错技术及其在组合导航系统中的应用研究[D];哈尔滨工程大学;2004年

4 杨金民;低开销的回卷恢复容错技术研究[D];湖南大学;2005年

5 陈阿莲;新型多电平逆变器组合拓扑结构和多电平逆变器的容错技术[D];浙江大学;2005年

6 王继刚;高可用集群系统中回卷恢复容错技术研究[D];哈尔滨工程大学;2006年

7 柳林;面向3G的H.264/AVC压缩视频通信技术研究[D];浙江大学;2006年

8 黄海林;高可靠处理器体系结构研究[D];中国科学院研究生院(计算技术研究所);2006年

9 卢鸿谦;SINS/GPS组合导航性能增强技术研究[D];哈尔滨工业大学;2006年

10 李德华;面向三维显示的海量地形数据管理及实时交互技术研究[D];华中科技大学;2006年

相关硕士学位论文 前10条

1 张华健;基于集群系统状态的检查点技术的研究[D];哈尔滨工程大学;2008年

2 李佳;MPICH并行集群系统的建立及其在大规模计算化学中的应用研究[D];重庆大学;2004年

3 武星燕;Linux集群的进程迁移技术研究[D];哈尔滨工程大学;2008年

4 迟忠惠;基于进程迁移的负载均衡算法的研究[D];中国海洋大学;2005年

5 薛瑞尼;面向集群系统的MPI并行程序容错技术研究[D];清华大学;2005年

6 何入海;基于Linux的集群系统的研究与实现[D];重庆大学;2002年

7 李宪武;基于Linux集群系统负载均衡的研究和实现[D];西安电子科技大学;2008年

8 王兰;集群系统的自动化测试技术的研究与实现[D];西安电子科技大学;2008年

9 向文;集群管理系统的研究与设计[D];辽宁师范大学;2008年

10 朱华;基于J2EE的配置服务在集群系统中的应用与研究[D];中南大学;2009年



本文编号:2621224

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2621224.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9a6cf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com