移动计算环境下检查点回卷恢复容错技术研究
发布时间:2024-12-10 00:12
高性能计算、互联网、无线通信、分布式计算、普适计算和云计算等领域的迅速发展,极大地推动了移动计算技术的发展。与传统固定有线分布式环境相比,移动计算系统具备临时搭建、自治、节点移动和网络拓扑结构易变等特点,拥有广阔的应用前景。但移动计算环境下进程发生故障的概率远大于传统的有线分布式计算系统,有线分布式计算系统的检查点回卷恢复容错技术已无法适用移动计算环境,因此,为移动计算系统设计高效的检查点回卷恢复容错机制是十分有意义的。依据检查点回卷恢复容错机制的研究现状和存在问题,本文围绕移动计算环境下检查点回卷恢复容错技术开展相关研究,具体包括: (1)对移动计算环境下进程日志存储维护进行了研究,基于m-MSS-m模型和进程分段确定性执行模型假定,提出了低开销的进程事件日志记录机制。该机制具备以下特点:移动支持站统一存储维护服务组内移动主机计算进程检查点、事件日志和日志间先于偏序依赖关系;各进程检查点信息和事件日志以确定因子的形式记录于一维数组;计算进程历经事件间先于偏序依赖关系由数组元素的先后顺序表示;进程日志先被同步记录到移动支持站的高速内存,仅在特定事件的触发下异步更新到可靠存储设备。
...
【文章页数】:126 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究目的和意义
1.2 国内外研究现状
1.2.1 系统模型
1.2.2 检查点回卷恢复机制
1.3 论文结构
第2章 进程事件日志记录机制
2.1 引言
2.2 进程容错信息存储管理
2.3 进程检查点与事件日志记录
2.3.1 MSS 日志记录结构
2.3.2 事件日志格式
2.3.3 MH 容错信息
2.4 事件日志记录机制
2.4.1 MH 容错操作
2.4.2 MSS 日志记录过程
2.4.3 进程容错信息垃圾回收
2.4.4 事件日志实例
2.5 本章小结
第3章 故障进程回卷恢复机制
3.1 引言
3.2 故障回卷恢复
3.3 进程状态先于偏序依赖关系
3.4 系统进程状态一致恢复分析
3.4.1 进程一致恢复条件
3.4.2 一致恢复形式化约束条件
3.5 完备容错日志下故障进程回卷恢复
3.5.1 完备容错日志下条件一判定
3.5.2 完备容错日志下条件二与条件三判定
3.6 不完备容错日志下故障进程回卷恢复
3.6.1 不完备容错日志下条件一判定
3.6.2 不完备容错日志下条件二与条件三判定
3.7 本章小结
第4章 移动计算容错机制优化
4.1 引言
4.2 进程检查点存储优化
4.3 进程事件日志记录优化
4.4 基于冗余信息分块的弱迁移管理
4.4.1 进程检查点操作相关调整
4.4.2 垃圾回收过程调整
4.4.3 进程回卷恢复调整
4.4.4 进程核心容错信息大小
4.5 本章小结
第5章 确定进程检查点间隔
5.1 引言
5.2 泊松故障分布下检查点间隔
5.2.1 进程状态转换
5.2.2 等距检查点间隔优化模型
5.2.3 优化检查点间隔拟合曲线
5.3 任意故障分布下检查点间隔
5.3.1 泊松故障事件分布
5.3.2 任意故障事件分布
5.4 本章小结
第6章 性能分析
6.1 引言
6.2 基于日志容错机制对比
6.3 容错信息迁移维护分析
6.4 检查点间隔优化分析
6.5 本章小结
结论
参考文献
攻读博士学位期间发表的论文
致谢
本文编号:4015293
【文章页数】:126 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究目的和意义
1.2 国内外研究现状
1.2.1 系统模型
1.2.2 检查点回卷恢复机制
1.3 论文结构
第2章 进程事件日志记录机制
2.1 引言
2.2 进程容错信息存储管理
2.3 进程检查点与事件日志记录
2.3.1 MSS 日志记录结构
2.3.2 事件日志格式
2.3.3 MH 容错信息
2.4 事件日志记录机制
2.4.1 MH 容错操作
2.4.2 MSS 日志记录过程
2.4.3 进程容错信息垃圾回收
2.4.4 事件日志实例
2.5 本章小结
第3章 故障进程回卷恢复机制
3.1 引言
3.2 故障回卷恢复
3.3 进程状态先于偏序依赖关系
3.4 系统进程状态一致恢复分析
3.4.1 进程一致恢复条件
3.4.2 一致恢复形式化约束条件
3.5 完备容错日志下故障进程回卷恢复
3.5.1 完备容错日志下条件一判定
3.5.2 完备容错日志下条件二与条件三判定
3.6 不完备容错日志下故障进程回卷恢复
3.6.1 不完备容错日志下条件一判定
3.6.2 不完备容错日志下条件二与条件三判定
3.7 本章小结
第4章 移动计算容错机制优化
4.1 引言
4.2 进程检查点存储优化
4.3 进程事件日志记录优化
4.4 基于冗余信息分块的弱迁移管理
4.4.1 进程检查点操作相关调整
4.4.2 垃圾回收过程调整
4.4.3 进程回卷恢复调整
4.4.4 进程核心容错信息大小
4.5 本章小结
第5章 确定进程检查点间隔
5.1 引言
5.2 泊松故障分布下检查点间隔
5.2.1 进程状态转换
5.2.2 等距检查点间隔优化模型
5.2.3 优化检查点间隔拟合曲线
5.3 任意故障分布下检查点间隔
5.3.1 泊松故障事件分布
5.3.2 任意故障事件分布
5.4 本章小结
第6章 性能分析
6.1 引言
6.2 基于日志容错机制对比
6.3 容错信息迁移维护分析
6.4 检查点间隔优化分析
6.5 本章小结
结论
参考文献
攻读博士学位期间发表的论文
致谢
本文编号:4015293
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4015293.html