基于事件的分布式系统监控
发布时间:2020-06-12 16:04
【摘要】: 随着分布式系统趋于复杂,运行时的监控在提高系统性能和可靠性上发挥了越来越重要的作用。本文主要提出一个结合监控探针平台与复杂事件处理技术的新方法,可以完成运行时的分布式系统监控,降低监控组件的开发和使用难度,提高监控管理的效率。 监控探针平台运行于受监控的资源之上,提供对JMX组件的通用管理接口。监控组件被封装为JMX探针,从而探针平台可以对探针进行运行时的部署、元数据生成、管理和检索,统一了探针的信息查询和操作调用方式,且与现有JMX产品兼容。 探针采用事件方式汇报监控信息,为了提高事件在网络中的传输效率与可靠性,在传输事件之前,会经过扩展的事件过滤,之后再封装为消息发往监控服务器。 为了能迅速应对大量的探针监控事件并分析事件间的时序与关联关系,监控服务器使用了基于复杂事件处理的监控规则,将监控事件交由复杂事件引擎进行实时处理。监控规则使用类似SQL的语法描述复杂事件,对输入的基本监控事件进行过滤、关联和聚集等操作,抽象出更高层的管理事件。管理事件一旦被判定发生,对应的管理决策动作会被触发,通过操控各个监控探针操作,实现运行时的分布式系统自动配置与管理。 上述的分布式系统监控与复杂事件处理技术已经用于仿真计算平台。根据该项目的实际需求与实践经验,本文以仿真作业分发调度、作业运行监控、系统性能评估以及节点信息统计等为例展示了监控系统的事件定义、规则配置、响应动作绑定和决策调度等功能。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP338.8
本文编号:2709771
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP338.8
【引证文献】
相关期刊论文 前1条
1 孙莉;李洋;李继云;;基于CEP的分布式IT资源监控事件关联方案[J];计算机应用与软件;2013年08期
相关硕士学位论文 前2条
1 周宏亮;室内即时定位系统的可视化监控技术研究与实现[D];上海交通大学;2012年
2 李洋;基于复杂事件处理的系统监控事件关联的研究与实现[D];东华大学;2013年
,本文编号:2709771
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2709771.html