基于分级检查点技术的移动云容错策略
发布时间:2021-09-11 14:06
移动云系统技术的快速发展,使得其复杂度日益提高,系统故障概率急遽增大。这些故障不仅会对服务提供商和用户造成巨额经济损失,还可能导致严重的灾难性事件。因此,移动云系统的容错性能成为了一个重要的研究课题,其中,基于分级检查点技术的容错策略成为了当前移动云容错领域的主要技术。本文主要对分级检查点技术进行了研究,已经取得的研究成果主要包括:1.针对当前移动云容错开销较大的问题,本文依据随机更新回报理论,结合系统故障概率分布函数和累积分布函数,提出了一种基于分级检查点技术的容错算法,对分级检查点设置频率进行了动态确定。通过大量实验验证了本文算法不仅可以对不同类型故障进行针对性容错,同时可以有效的降低系统优化容错的开销,为移动云容错策略提供了一种新的解决方案。2.为提高移动云系统的服务质量(Quality of Service,QoS),分级检查点必须具有高可用性和高可靠性。因此,本文设计了一种基于超图覆盖的分级检查点存储策略。首先,运用本文提出的容错算法,获取到分级检查点的时间序列。然后,基于超图理论对分级检查点的存储位置进行决策。通过实验比较证明,本文提出的策略在存储任务的执行时间开销和均衡系...
【文章来源】:重庆邮电大学重庆市
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
设置检查点时间开销
(a) 系统故障概率服从指数分布时重算时间开销(b) 系统故障概率服从威布尔分布时重算时间开销图 3.4 发生故障后重新计算时间开销移动应用程序执行期间导致故障发生的未知影响因素非常多,即故障无法规避,其类型也无法人为干预。由图 3.4(a)和图 3.4(b)可知,系统故障率服从指数分布或者服从威布尔分布的情况下,HCM模型中发生故障后重算时间开销相对较少。在移动云系统中,虽然发生故障后可以回滚到最新可用检查点位置对故障进行恢复,但仍然会损失发生故障时刻到检查点时刻之间的任务进度。因此,发生故障后重算时间开销越少,对减少系统容错开销和保障移动云 QoS 来说很有利。
图 3.5(a)和图 3.5(b)对比分析了在故障率服从指数分布和威布尔分布情况下,HCM 模型和两级增量检查点策略的故障恢复时间开销。从这两个图能够显而易见地看出,HCM 模型具有较少的故障恢复时间开销。通过对以上三部分时间开销进行叠加可以得到移动云系统总额外时间开销,如图 3.6(a)和图 3.6(b)所示。根据图 3.6(a)中的数据可以看出,在移动云系统的故障概率分布服从指数分布时,HCM 模型相对与两级增量检查点策略而言,虽然设置检查点的时间开销更大,但进行恢复恢复的时间开销减小,从总额外时间开销来看HCM 模型具有更小时间开销。同样,从图 3.6(b)中可以得出,当移动云系统故障概率分布服从威布尔分布时,采用 HCM 模型的系统中总额外时间开销相对两级增量检查点策略也较小。由此可得出结论,本章所提出的 HCM 模型能有效的为移动云系统提供容错功能,且在一定程度上降低了容错开销。
【参考文献】:
期刊论文
[1]日志检查点回卷恢复策略的检查点周期求解模型[J]. 徐振朋,门朝光,李香. 高技术通讯. 2011 (06)
硕士论文
[1]面向并行微重启的检查点优化方法[D]. 谷雷.哈尔滨工程大学 2017
[2]面向云平台的协同卷回恢复关键技术研究[D]. 黄友富.哈尔滨工业大学 2014
本文编号:3393138
【文章来源】:重庆邮电大学重庆市
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
设置检查点时间开销
(a) 系统故障概率服从指数分布时重算时间开销(b) 系统故障概率服从威布尔分布时重算时间开销图 3.4 发生故障后重新计算时间开销移动应用程序执行期间导致故障发生的未知影响因素非常多,即故障无法规避,其类型也无法人为干预。由图 3.4(a)和图 3.4(b)可知,系统故障率服从指数分布或者服从威布尔分布的情况下,HCM模型中发生故障后重算时间开销相对较少。在移动云系统中,虽然发生故障后可以回滚到最新可用检查点位置对故障进行恢复,但仍然会损失发生故障时刻到检查点时刻之间的任务进度。因此,发生故障后重算时间开销越少,对减少系统容错开销和保障移动云 QoS 来说很有利。
图 3.5(a)和图 3.5(b)对比分析了在故障率服从指数分布和威布尔分布情况下,HCM 模型和两级增量检查点策略的故障恢复时间开销。从这两个图能够显而易见地看出,HCM 模型具有较少的故障恢复时间开销。通过对以上三部分时间开销进行叠加可以得到移动云系统总额外时间开销,如图 3.6(a)和图 3.6(b)所示。根据图 3.6(a)中的数据可以看出,在移动云系统的故障概率分布服从指数分布时,HCM 模型相对与两级增量检查点策略而言,虽然设置检查点的时间开销更大,但进行恢复恢复的时间开销减小,从总额外时间开销来看HCM 模型具有更小时间开销。同样,从图 3.6(b)中可以得出,当移动云系统故障概率分布服从威布尔分布时,采用 HCM 模型的系统中总额外时间开销相对两级增量检查点策略也较小。由此可得出结论,本章所提出的 HCM 模型能有效的为移动云系统提供容错功能,且在一定程度上降低了容错开销。
【参考文献】:
期刊论文
[1]日志检查点回卷恢复策略的检查点周期求解模型[J]. 徐振朋,门朝光,李香. 高技术通讯. 2011 (06)
硕士论文
[1]面向并行微重启的检查点优化方法[D]. 谷雷.哈尔滨工程大学 2017
[2]面向云平台的协同卷回恢复关键技术研究[D]. 黄友富.哈尔滨工业大学 2014
本文编号:3393138
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3393138.html