面向事务存储系统的容错技术研究
发布时间:2020-12-05 13:23
随着多核处理器的发展,事务存储作为一种有潜力的并发控制机制受到了越来越多的关注。另一方面,随着大规模集成电路的发展进入深亚微米级甚至纳米级,处理器更容易受电磁辐射、宇宙射线以及其它干扰源的影响,这使得处理器的可靠性问题变得日益突出。因此事务存储机制下的容错问题也将逐渐成为一个值得关注的问题。本文针对事务存储系统下的容错问题展开研究,以事务存储系统中的错误传播行为为理论基础,围绕故障检测、故障恢复和故障屏蔽等几个关键问题提出了理论方法、技术方案和实现框架。本文的主要贡献如下:1.以基于程序语句序列的语句间的错误传播行为为始,层层递进的分析了错误在事务存储系统中的传播行为。通过对事务自身的属性和特点的分析,针对容错位置和容错对象集合这两个容错技术主要关心的信息,给出了事务存储系统中两类天然的容错位置及对应的容错对象集合,并证明了其所具有的不同的容错能力,从理论上揭示了事务存储系统天然的容错特性。2.提出了基于事务冗余的错误检测方法——EDRT错误检测方法。该方法为事务创建冗余副本,并同时执行事务及其副本,通过在提交前比较两事务的写集合实现了低错误检测开销的基于冗余事务的错误检测方法。此外,...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:148 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.1.1 事务存储的兴起
1.1.2 微处理器的可靠性问题
1.2 事务存储系统
1.2.1 事务存储系统的基本概念和分类
1.2.2 事务存储系统的实现
1.3 可靠性及容错研究基础
1.3.1 系统可靠性的影响因素
1.3.2 容错技术
1.4 相关工作
1.4.1 故障检测技术
1.4.2 故障恢复技术
1.4.3 故障屏蔽技术
1.4.4 基于事务存储的容错技术
1.5 本文的研究内容及主要创新点
1.5.1 本文的研究内容
1.5.2 本文的创新点
1.6 论文结构
第二章 错误在事务存储系统中的传播行为分析
2.1 程序语句间的错误传播
2.1.1 语句间的错误传播
2.1.2 任务段的错误隔离
2.2 事务间的错误传播
2.2.1 事务间的错误传播
2.2.2 事务存储系统的错误隔离
2.3 小结
第三章 基于事务冗余的错误检测
3.1 基于事务冗余的错误检测方法
3.1.1 EDRT 的基本思想
3.1.2 开销分析
3.1.3 错误检测能力分析
3.2 容错日志事务存储系统:FTLogTM
3.2.1 数据比较集
3.2.2 冲突检测机制
3.3 容错缓存事务存储系统:FTBufTM
3.3.1 数据比较集
3.3.2 冲突检测机制
3.4 实验与评测
3.4.1 实验方法
3.4.2 实验结果
3.5 小结
第四章 基于事务回退的故障恢复
4.1 基于FRTR 的容错事务存储系统
4.1.1 FRTR 的基本思想
4.1.2 一个例子
4.1.3 FRTR 的开销分析
4.2 容错事务存储系统的隔离性
4.2.1 基于Eager 冲突检测机制的容错事务存储系统的隔离性
4.2.2 基于Lazy 冲突检测机制的容错事务存储系统的隔离性
4.2.3 FRTR 对故障恢复的充分性
4.3 实验与评测
4.3.1 实验方法
4.3.2 实验结果
4.4 事务存储系统中基于并行复算的故障恢复
4.4.1 基本思想
4.4.2 针对OpenTM 程序的并行复算
4.4.3 实验与评测
4.5 小结
第五章 基于三模冗余的容错方法
5.1 事务的三模冗余容错方法:TriTM
5.1.1 TriTM 的基本思想
5.1.2 TriTM 的性能优化
5.1.3 TriTM 的比较点设置
5.2 基于Closed 嵌套事务的TriTM 的实现
5.2.1 嵌套事务存储系统
5.2.2 TriTM 的实现
5.3 实验与评测
5.3.1 实验方法
5.3.2 实验结果
5.4 小结
第六章 结论与展望
6.1 工作总结
6.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
作者在学期间参加的科研项目
本文编号:2899517
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:148 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.1.1 事务存储的兴起
1.1.2 微处理器的可靠性问题
1.2 事务存储系统
1.2.1 事务存储系统的基本概念和分类
1.2.2 事务存储系统的实现
1.3 可靠性及容错研究基础
1.3.1 系统可靠性的影响因素
1.3.2 容错技术
1.4 相关工作
1.4.1 故障检测技术
1.4.2 故障恢复技术
1.4.3 故障屏蔽技术
1.4.4 基于事务存储的容错技术
1.5 本文的研究内容及主要创新点
1.5.1 本文的研究内容
1.5.2 本文的创新点
1.6 论文结构
第二章 错误在事务存储系统中的传播行为分析
2.1 程序语句间的错误传播
2.1.1 语句间的错误传播
2.1.2 任务段的错误隔离
2.2 事务间的错误传播
2.2.1 事务间的错误传播
2.2.2 事务存储系统的错误隔离
2.3 小结
第三章 基于事务冗余的错误检测
3.1 基于事务冗余的错误检测方法
3.1.1 EDRT 的基本思想
3.1.2 开销分析
3.1.3 错误检测能力分析
3.2 容错日志事务存储系统:FTLogTM
3.2.1 数据比较集
3.2.2 冲突检测机制
3.3 容错缓存事务存储系统:FTBufTM
3.3.1 数据比较集
3.3.2 冲突检测机制
3.4 实验与评测
3.4.1 实验方法
3.4.2 实验结果
3.5 小结
第四章 基于事务回退的故障恢复
4.1 基于FRTR 的容错事务存储系统
4.1.1 FRTR 的基本思想
4.1.2 一个例子
4.1.3 FRTR 的开销分析
4.2 容错事务存储系统的隔离性
4.2.1 基于Eager 冲突检测机制的容错事务存储系统的隔离性
4.2.2 基于Lazy 冲突检测机制的容错事务存储系统的隔离性
4.2.3 FRTR 对故障恢复的充分性
4.3 实验与评测
4.3.1 实验方法
4.3.2 实验结果
4.4 事务存储系统中基于并行复算的故障恢复
4.4.1 基本思想
4.4.2 针对OpenTM 程序的并行复算
4.4.3 实验与评测
4.5 小结
第五章 基于三模冗余的容错方法
5.1 事务的三模冗余容错方法:TriTM
5.1.1 TriTM 的基本思想
5.1.2 TriTM 的性能优化
5.1.3 TriTM 的比较点设置
5.2 基于Closed 嵌套事务的TriTM 的实现
5.2.1 嵌套事务存储系统
5.2.2 TriTM 的实现
5.3 实验与评测
5.3.1 实验方法
5.3.2 实验结果
5.4 小结
第六章 结论与展望
6.1 工作总结
6.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
作者在学期间参加的科研项目
本文编号:2899517
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2899517.html