云环境下基于统计监测的分布式软件系统故障检测技术研究
发布时间:2019-09-29 12:34
【摘要】:越来越多的分布式软件系统部署在公有云计算平台,通过互联网向外提供服务.云计算环境的复杂性、动态性和开放性使得分布式软件系统更易于出现故障,造成服务失效,从而影响大量用户正常使用,甚至造成巨大经济损失.故障检测技术旨在自动及时的检测系统故障的发生,以避免或减少服务失效所带来的损失,是保障分布式软件系统性能与可靠性的关键技术之一.云计算环境对该技术带来了新的挑战,该文首先分析了这些挑战.基于统计监测的故障检测技术在线搜集监测数据构建统计模型,并基于该模型对系统运行状态进行分析与预测,具有实时监测分析、自动化检测、无需领域知识等优势,能够满足云环境的需要,因此引起了学术界和工业界的广泛关注.该文提出了面向云计算环境的基于统计监测的分布式软件系统故障管理参考框架,包括分布式监测、监测数据处理、故障检测、故障诊断以及故障处理等模块;将已有工作分成基于规则、度量分析、日志分析和行为分析等四大类,逐类介绍其实现原理,并对比分析各类的优缺点;针对当前云计算环境的特点,从在线自动检测、运行环境感知和组件交互分析等3个方面展望了未来的研究方向.
【作者单位】: 中国科学院软件研究所;
【分类号】:TP311
【作者单位】: 中国科学院软件研究所;
【分类号】:TP311
【相似文献】
相关会议论文 前2条
1 房友园;齐璇;;面向通信协议故障的分布式软件可靠性测试技术研究[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
2 张树兵;叶宏;戴小氐;刘建军;;面向IMA的机载分布式软件调试初探[A];探索 创新 交流(第4集)——第四届中国航空学会青年科技论坛文集[C];2010年
相关博士学位论文 前2条
1 刘东红;大规模分布式软件系统的伴随式监控技术研究[D];国防科学技术大学;2011年
2 张波;基于XML的分布式软件体系结构研究[D];中国科学院软件研究所;2001年
相关硕士学位论文 前10条
1 罗贞;一种实时分布式软件可靠性评测技术的研究[D];华中科技大学;2004年
2 朱良;实时分布式软件建模技术研究[D];西北工业大学;2007年
3 王文龙;分布式软件开发平台的设计与实施[D];北京邮电大学;2011年
4 黄隽;反馈使能的分布式软件运行时行为监测方法[D];湖南工业大学;2012年
5 李s,
本文编号:2543937
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2543937.html