云环境下的多域服务故障管理技术研究
发布时间:2019-07-12 18:09
【摘要】:随着云计算应用的深入,越来越多的网络资源以信息化服务的形式在互联网上发布。如何对这些部署在不同管理域的服务进行有效的故障管理已经成为服务管理的研究重点。针对云环境下多域服务故障管理面临的挑战,本文开展了以下几个方面的研究。(1)多域服务故障管理框架。域内故障管理系统对单个管理域内的服务故障管理的主要内容进行了定义。在域内故障管理系统的基础上,提出了多域服务故障管理框架,定义了多域协同故障管理机制和多域故障管理交互模型。(2)域内故障管理技术。通过主动部署监测探针的症状监测技术对管理对象进行监测,采集症状服务相关信息;针对预设先验概率不可靠这一问题,提出了概率更新的故障定位算法,根据历史故障概率对故障先验概率进行更新;提出了服务故障调控策略,对故障服务进行替换,提高了服务的可用性。(3)多域协同故障管理技术。根据症状与管理域之间的依赖关系,提出了域间依赖模型,并设计了症状簇划分算法,将症状集合中具有关联性的症状划分在同一症状簇进行联合诊断。通过基于域间依赖模型的多域故障诊断算法对跨域症状与管理域的依赖关系进行概率评估,选定关联管理域进行诊断,完成故障定位。针对多域故障诊断算法性能不高的问题,提出了故障集合更小的筛选算法。针对多域故障管理的交互需求,设计了多域故障交互协议,实现了域间症状诊断信息的交互。(4)在上述技术的基础上,完成了多域故障管理原型系统,实现了域内故障管理,能够对跨域服务进行症状监测,完成跨域症状的故障诊断,并对故障服务进行替换。本文以多域服务故障管理框架为基础,域内故障管理技术和多域协同故障管理技术为支撑,多域故障管理系统为应用,提供了多域服务故障管理比较完整的解决方案。
文内图片:
图片说明: 障处置模块实现模块主要功能是对症状监测模块发现的症状进行处理,并需的故障相关信息。故障定位算法、故障调控算法均由 ja系统可以通过接口对它们进行调用。模块还通过jsp和servlet等相关技术,对故障管理相关信息可以在与故障管理服务器相连的主机上查看故障管理信息障数据库实现库是多域服务故障管理系统的重要组成部分,数据库存储理域信息、服务从属关系、贝叶斯概率数据、历史统计数域信息如图 6.2 所示,储存了参与多域协同故障管理的管、管理域故障管理系统通信地址和端口号。在跨域症状诊断可以根据域名查询通信地址和端口号,,与相关管理域进行
文内图片:
图片说明: 图 6.3 服务从属关系用的贝叶斯概率数据如图 6.4 所示,存储了服务了简化计算,这里将服务节点视作它本身的一个jectId2 字段分别表示服务节点 ID 和子服务节点现故障后,服务节点出现症状的概率;Obj2fail 率;pass2 字段表示服务节点的症状由子服务节图 6.4 贝叶斯概率数据数据如图 6.5 所示,serviceID 表示服务 ID,fail据表示运行故障定位算法的总次数。根据故障概率数据进行实时更新,提高系统故障定位的准
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09
本文编号:2513885
文内图片:
图片说明: 障处置模块实现模块主要功能是对症状监测模块发现的症状进行处理,并需的故障相关信息。故障定位算法、故障调控算法均由 ja系统可以通过接口对它们进行调用。模块还通过jsp和servlet等相关技术,对故障管理相关信息可以在与故障管理服务器相连的主机上查看故障管理信息障数据库实现库是多域服务故障管理系统的重要组成部分,数据库存储理域信息、服务从属关系、贝叶斯概率数据、历史统计数域信息如图 6.2 所示,储存了参与多域协同故障管理的管、管理域故障管理系统通信地址和端口号。在跨域症状诊断可以根据域名查询通信地址和端口号,,与相关管理域进行
文内图片:
图片说明: 图 6.3 服务从属关系用的贝叶斯概率数据如图 6.4 所示,存储了服务了简化计算,这里将服务节点视作它本身的一个jectId2 字段分别表示服务节点 ID 和子服务节点现故障后,服务节点出现症状的概率;Obj2fail 率;pass2 字段表示服务节点的症状由子服务节图 6.4 贝叶斯概率数据数据如图 6.5 所示,serviceID 表示服务 ID,fail据表示运行故障定位算法的总次数。根据故障概率数据进行实时更新,提高系统故障定位的准
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09
【参考文献】
相关期刊论文 前10条
1 张顺利;邱雪松;孟洛明;;网络虚拟化环境下的服务故障诊断算法[J];软件学报;2012年10期
2 鞠小林;姜淑娟;张艳梅;董国伟;;软件故障定位技术进展[J];计算机科学与探索;2012年06期
3 李晶;朱敏;;一种基于事件驱动的SOA故障疑似集选择算法[J];计算机应用与软件;2011年05期
4 樊宁;;贝叶斯网络推理算法在故障诊断中的应用[J];信息技术;2011年03期
5 唐渊;;Web Services组合的容错方法[J];湖南工业大学学报;2010年06期
6 印莹;张斌;张锡哲;;面向组合服务动态自适应的事务级主动伺机服务替换算法[J];计算机学报;2010年11期
7 刘丽;况晓辉;方兰;许飞;;Web服务故障的分类方法[J];计算机系统应用;2010年08期
8 褚灵伟;邹仕洪;程时端;田春岐;王文东;胡博;;多域服务环境下的分布式故障诊断算法[J];电子与信息学报;2010年04期
9 印莹;张斌;张锡哲;;基于具体事务的补偿支持服务替换QoS模型[J];东北大学学报(自然科学版);2010年01期
10 褚灵伟;邹仕洪;程时端;田春岐;王文东;;一种动态环境下的互联网服务故障诊断算法[J];软件学报;2009年09期
本文编号:2513885
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2513885.html