Pigeon统一告警平台的设计与实现
发布时间:2020-04-07 20:11
【摘要】:随着电商行业的迅猛发展,企业业务的不断扩张,系统通讯网络扩大,接入系统越来越多,系统间的信息通讯暴增,对系统及运行系统的设备管理越来越复杂,正因为系统间存在大量通讯信息,若系统设备出现故障,必定会影企业整个网络的正常运行。因此,对系统及设备的故障监控和管理是非常必要的。出于以上原因,企业迫切需要设计一个能统一管理企业内部各个系统及其通讯设备的告警系统,监控系统及其通讯设备的运作情况,在各个系统或设备发生故障时可以及时生成告警信息,使相关系统处理人员可以根据告警信息快速定位故障根源,并通知操作人员处理故障。Pigeon统一告警平台,就是为了解决以上的告警处理问题而设计的。它能对系统或设备发出的告警进行监控,并且通过告警关联条件和配置过滤条件,使得监控过程更加有目的性,并且将关键告警信息通过短信、邮件或工单发送到故障处理人,提醒故障处理人及时处理。它还能通过分析过去的告警历史记录,使用相关的预测算法,对可能发生的告警进行预测。首先,本文讨论了项目背景,在此基础上,提出告警平台的业务需求分析、功能性需求分析以及非功能性需求分析。然后进行了系统的架构设计,技术架构使用了公司统一要求的Spring-MVC架构。告警平台的总体设计主要分为横向的四大模块设计;纵向的物理结构层次设计。最后进一步得出了系统的详细设计。Pigeon统一告警平台主要分成了四个大模块:可视化操作界面web模块、告警关联定时任务job模块、告警监控分析analyer模块、告警处理及推送webservice模块。通过各种UML展示各个模块的工作流程,类关系,数据库设计,为系统的实现做好准备。其中表现层应用WEB前段开发常用的HTML5+VUE+JS架构技术,使用flex进行告警数据的实时展示,接口之间的传输则使用规范化的Json格式。Idea15作为开发平台,持久层数据库使用MySQL,缓存数据库使用Redis。在业务层,所述第一地图上显示了实现系统和各个模块的整体效果,然后是告警监控分析模块详细描述的设计及实现。最后,截取统一告警平台的运行界面,在分析了用户需求的基础上,利用公司现有的环境,完成了Pigeon统一告警平台从设计到实现的全部过程。
【图文】:
图 2-1 告警处理流程图过提供给各个系统的定时推送接口以及采集调度系统,可的告警数据,统一告警平台的告警采集兼容各个厂商的不同集的告警信息存储在 kafka 的消息队列当中。由于从网络格式,有的是 JSON 格式,有的是 XML 格式,无法获取有效的告警进行收敛解析,使之成为标准规范且统一格式的数据则按照对应过滤规则将其过滤。设备由于不同厂商而产生告警格式不统一的问题,需要对根据不同的用户的关注点不同,重新定义告警级别与告警重新组合队列信息。然后设置与其关联的配置信息。的告警数据保存在 Redis 缓存数据库中。然后,根据不同据库中的告警信息进行初步分析过滤。这样,当采集到大
图 2-2 实时告警监控的例子图有一些模块尚未实现,正筹备第二阶段的开发,如告警锁定与解关联规则设置台能够提供用户定义关联规则和默认告警关联规则,对进入告警规则进行告警相关性分析。按照设定的告警之间的关联规则,告集的告警中的决定性告警,根据它定位故障的根源原因,使处理所影响的设备或应用系统,和其影响的业务。警的类型如下:警:由于根源故障的发生,同时发出了 X、Y 两个告警,那么源关系。通过它们可以回溯查找到根源的 Z 告警。告警:堆叠相似告警,,等告警堆积数量到达特定阈值才展现到界。将堆叠的相似告警只过滤出一条独立告警。定义堆叠的告警个规则,即形成频次告警。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
本文编号:2618334
【图文】:
图 2-1 告警处理流程图过提供给各个系统的定时推送接口以及采集调度系统,可的告警数据,统一告警平台的告警采集兼容各个厂商的不同集的告警信息存储在 kafka 的消息队列当中。由于从网络格式,有的是 JSON 格式,有的是 XML 格式,无法获取有效的告警进行收敛解析,使之成为标准规范且统一格式的数据则按照对应过滤规则将其过滤。设备由于不同厂商而产生告警格式不统一的问题,需要对根据不同的用户的关注点不同,重新定义告警级别与告警重新组合队列信息。然后设置与其关联的配置信息。的告警数据保存在 Redis 缓存数据库中。然后,根据不同据库中的告警信息进行初步分析过滤。这样,当采集到大
图 2-2 实时告警监控的例子图有一些模块尚未实现,正筹备第二阶段的开发,如告警锁定与解关联规则设置台能够提供用户定义关联规则和默认告警关联规则,对进入告警规则进行告警相关性分析。按照设定的告警之间的关联规则,告集的告警中的决定性告警,根据它定位故障的根源原因,使处理所影响的设备或应用系统,和其影响的业务。警的类型如下:警:由于根源故障的发生,同时发出了 X、Y 两个告警,那么源关系。通过它们可以回溯查找到根源的 Z 告警。告警:堆叠相似告警,,等告警堆积数量到达特定阈值才展现到界。将堆叠的相似告警只过滤出一条独立告警。定义堆叠的告警个规则,即形成频次告警。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.52
【参考文献】
相关硕士学位论文 前6条
1 常春艳;基于TELNET协议网络管理软件的设计与实现[D];大庆石油学院;2009年
2 张婷玉;基于CORBA的移动通信网管北向接口设计[D];上海交通大学;2008年
3 张远洋;综合网管告警采集模块的设计与实现[D];重庆大学;2008年
4 张晓谦;TELNET通用数据采集系统的研究与实现[D];吉林大学;2007年
5 张伟;通信综合网管系统故障管理的设计和实现[D];西安电子科技大学;2006年
6 王中平;基于CORBA的电信网管性能管理系统的研究与实现[D];西安电子科技大学;2006年
本文编号:2618334
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2618334.html