低开销的回卷恢复容错技术研究
发布时间:2023-05-19 23:27
互联网、PC机和Windows操作系统现已非常普及。构建在这种平台上的应用系统, 其可用性是一个备受关注的问题。作为一种低成本的容错策略,回卷恢复技术对该类大 众化的应用系统是一种首选的容错解决方法。不过就该类应用而言,回卷恢复技术有待 进一步研究,其中关键问题是回卷恢复的实现问题和回卷恢复的开销。本论文的目标是: 研究实现回卷恢复系统的策略和方法,探讨提高回卷恢复系统性能的途径,评估回卷恢 复协议性能,提出新的回卷恢复策略,为回卷恢复技术的应用提供基础和支持。 本文研究了多线程进程检查点用户级实现问题,提出了基于虚拟对象的检查点实现 策略。基于虚拟对象的检查点实现策略不仅简化了检查点系统中的一些复杂问题,而且 克服了原有检查点实现中的一些局限性。在基于虚拟对象的检查点实现,我们提出了虚 拟对象的包裹成员函数原子方式执行的必要性,并给出了原子方式执行的一种实现方 法。 本文也研究了分布式系统回卷恢复的实现问题,提出了多线程化的回卷恢复统一框 架。回卷恢复协议多种多样,我们通过分析它们间存在的共性,归纳出了一个基于事件 驱动的回卷恢复统一框架。我们研究了进程中发送消息,接收消息,处理消息...
【文章页数】:132 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
插图索引
附表索引
第1章 引言
1.1 回卷恢复容错面临的新课题
1.2 本论文的主要工作
1.3 论文的整体结构和章节安排
第2章 回卷恢复基本概念和研究现状概述
2.1 软件容错技术简介
2.2 回卷恢复系统模型和基本概念
2.3 回卷恢复研究现状
2.3.1 进程检查点
2.3.2 检查点和消息日志
2.3.3 故障恢复
2.3.4 输出提交
2.3.5 垃圾回收
2.3.6 性能评估和优化
2.3.7 回卷恢复技术的应用
第3章 基于虚拟对象的多线程进程检查点实现策略
3.1 进程检查点系统的研究现状
3.2 基于虚拟对象的进程检查点实现框架
3.3 虚拟对象包裹成员函数原子方式执行的必要性和实现策略
3.4 多线程进程检查点算法
3.5 检查点系统的实现
3.5.1 定时器对象信号状态
3.5.2 进程中线程数的动态变化
3.5.3 回卷恢复时线程栈的定位
3.5.4 线程局部变量和异常处理信息的保存与恢复
3.5.5 应用程序堆内存分配
3.5.6 Win32 API调用截获技术
3.5.7 检查点库注入技术
3.6 试验结果和性能优化
3.7 小结
第4章 多线程化的分布式系统回卷恢复实现框架
4.1 系统模型
4.2 多线程化的回卷恢复统一框架
4.2.1 回卷恢复统一框架
4.2.2 多线程化进程的工作负载
4.2.3 可重用和可延伸的回卷恢复基本组件
4.3 WINDAR: Windows平台下多线程化的回卷恢复试验平台原型
4.3.1 和广域网模拟器 NIST NET的集成
4.3.2 和消息传递接口库 MPICH的集成
4.4 性能评估
4.5 和相关研究的对比
4.6 小结
第5章 最小化协同检查点的检查点完成时间
5.1 系统模型
5.2 阻塞式协同检查点协议
5.3 故障恢复算法
5.4 性能结果
5.5 与相关研究的对比
5.6 小结
第6章 一种基于分块消息日志的回卷恢复协议
6.1 分块消息日志的动机
6.2 系统模型及回卷恢复协议
6.2.1 系统模型
6.2.2 分块消息日志协议
6.3 协议性能评估方法
6.4 协议特性及优化分析
6.5 相关研究
6.6 小结
第7章 限定广域网中大规模分布式系统的回卷恢复范围
7.1 问题的提出
7.2 分布式计算的层次模型及回卷恢复基本概念
7.3 消息依赖关系跟踪
7.3.1 主机层消息传递依赖关系跟踪
7.3.2 组层消息依赖关系跟踪协议
7.4 仿真实验结果
7.5 与相关研究的对比
7.6 小结
结论
致谢
参考文献
附录A 攻读博士学位期间发表论文、参加项目及获奖情况
本文编号:3820094
【文章页数】:132 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
插图索引
附表索引
第1章 引言
1.1 回卷恢复容错面临的新课题
1.2 本论文的主要工作
1.3 论文的整体结构和章节安排
第2章 回卷恢复基本概念和研究现状概述
2.1 软件容错技术简介
2.2 回卷恢复系统模型和基本概念
2.3 回卷恢复研究现状
2.3.1 进程检查点
2.3.2 检查点和消息日志
2.3.3 故障恢复
2.3.4 输出提交
2.3.5 垃圾回收
2.3.6 性能评估和优化
2.3.7 回卷恢复技术的应用
第3章 基于虚拟对象的多线程进程检查点实现策略
3.1 进程检查点系统的研究现状
3.2 基于虚拟对象的进程检查点实现框架
3.3 虚拟对象包裹成员函数原子方式执行的必要性和实现策略
3.4 多线程进程检查点算法
3.5 检查点系统的实现
3.5.1 定时器对象信号状态
3.5.2 进程中线程数的动态变化
3.5.3 回卷恢复时线程栈的定位
3.5.4 线程局部变量和异常处理信息的保存与恢复
3.5.5 应用程序堆内存分配
3.5.6 Win32 API调用截获技术
3.5.7 检查点库注入技术
3.6 试验结果和性能优化
3.7 小结
第4章 多线程化的分布式系统回卷恢复实现框架
4.1 系统模型
4.2 多线程化的回卷恢复统一框架
4.2.1 回卷恢复统一框架
4.2.2 多线程化进程的工作负载
4.2.3 可重用和可延伸的回卷恢复基本组件
4.3 WINDAR: Windows平台下多线程化的回卷恢复试验平台原型
4.3.1 和广域网模拟器 NIST NET的集成
4.3.2 和消息传递接口库 MPICH的集成
4.4 性能评估
4.5 和相关研究的对比
4.6 小结
第5章 最小化协同检查点的检查点完成时间
5.1 系统模型
5.2 阻塞式协同检查点协议
5.3 故障恢复算法
5.4 性能结果
5.5 与相关研究的对比
5.6 小结
第6章 一种基于分块消息日志的回卷恢复协议
6.1 分块消息日志的动机
6.2 系统模型及回卷恢复协议
6.2.1 系统模型
6.2.2 分块消息日志协议
6.3 协议性能评估方法
6.4 协议特性及优化分析
6.5 相关研究
6.6 小结
第7章 限定广域网中大规模分布式系统的回卷恢复范围
7.1 问题的提出
7.2 分布式计算的层次模型及回卷恢复基本概念
7.3 消息依赖关系跟踪
7.3.1 主机层消息传递依赖关系跟踪
7.3.2 组层消息依赖关系跟踪协议
7.4 仿真实验结果
7.5 与相关研究的对比
7.6 小结
结论
致谢
参考文献
附录A 攻读博士学位期间发表论文、参加项目及获奖情况
本文编号:3820094
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3820094.html