云平台容错能力测试套件的设计与实现
发布时间:2019-11-16 02:45
【摘要】:云计算是一个以提供弹性灵活、可靠高品质的计算服务为目的的存储、计算模式。云计算架构作为一个软件众多的复杂生态环境,整个系统有众多的组件,每个组件都有不同程度失控的可能性。所以在如此复杂的系统中,故障是不可避免的。因此对云平台容错能力的评测对其可靠性的研究有着重要的意义。目前为止,对于云计算平台及其各层软件测试的研究成果中,涉及评测的相关内容较少,且测试方法较为单一,急需进行更加深入的研究与完善。传统的评测策略大多都是靠通过搭建测试专用的模拟环境来进行评测。但对于云平台来说,其结构复杂,功能庞大,需长时间运行在高负载环境下等特点使得搭建的测试用环境与真实环境差距较大。这使得传统的云平台容错性测试策略难以充分体现云平台在真实环境中的情况。针对以上所述的问题,本文将面向服务的思想与传统的测试策略相结合,提出了基于服务的云平台测试策略。该测试策略具有测试环境真实,耦合度低,灵活性高等特点。可以有效的暴露出云平台各层软件存在的问题。此外使用故障注入的手段,对云平台各层设计了有代表性的故障集,通过故障注入的手段验证云平台各层服务的容错性能。基于以上思想进行了云平台容错测试套件的架构设计及软件实现。本文搭建了实验环境对实现的云平台容错测试套件进行测试,实验结果表明该测试套件具有良好的可扩展性,并能有效产生云平台各层故障。其产生的故障符合真实云计算环境中的不可预测性,同时验证了工具的有效性。对云平台容错性测试的研究有着指导作用。
【图文】:
图 3-2 随机故障注入机制设计机测试用例,并封装成类,以便调用端可以获得故一个随机故障测试用例包括 4 个属性:故障服务置或参数。为保证测试用例的随机性,这四个参池中选取,,进行组合,作为故障测试用例。为实
图 5-2 Hadoop 集群(30 Slave)进程故障结果图测试套件运行了 50 分钟,对于 Hadoop 集群共产生 5 个 NodeManager 进程故障。该进程故障使得产生故障的节点被集群标识为“丢失”(lost)。实验结果如图5-2 所示,从 Active Nodes 和 Lost Nodes 可以看出,集群共有 30 个 Slave 节点。第
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09
本文编号:2561628
【图文】:
图 3-2 随机故障注入机制设计机测试用例,并封装成类,以便调用端可以获得故一个随机故障测试用例包括 4 个属性:故障服务置或参数。为保证测试用例的随机性,这四个参池中选取,,进行组合,作为故障测试用例。为实
图 5-2 Hadoop 集群(30 Slave)进程故障结果图测试套件运行了 50 分钟,对于 Hadoop 集群共产生 5 个 NodeManager 进程故障。该进程故障使得产生故障的节点被集群标识为“丢失”(lost)。实验结果如图5-2 所示,从 Active Nodes 和 Lost Nodes 可以看出,集群共有 30 个 Slave 节点。第
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09
【参考文献】
相关期刊论文 前2条
1 周江;王伟平;孟丹;马灿;古晓艳;蒋杰;;面向大数据分析的分布式文件系统关键技术[J];计算机研究与发展;2014年02期
2 李宗伟;卫洁;;Hadoop分布式集群容错验证[J];中国市场;2011年48期
本文编号:2561628
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2561628.html