常用告警级别

告警级别用于标识一条告警的严重程度,按严重程度递减分为六级:紧急告警、重要告警、次要告警、提示告警、不确定告警和清除告警,如下表所示。

告警级别英文中文颜色说明
1critical紧急此类级别的故障影响到系统提供的服务,需要立即采取相应动作。如某设备或资源完全不可用,需进行恢复,即使该故障在非工作时间内发生,也需立即采取措施。
2major重要此类级别的故障影响到服务质量,需要采取紧急动作。如某设备或资源服务质量下降,需对其进行还原,恢复全部能力,需在工作时间内立即采取措施。
3minor次要此类级别的故障还未影响到服务质量,但为了避免更严重的故障,需要在适当时候进行处理或进一步观察。
4warning警告此类级别的故障指示可能有潜在的错误影响到提供的服务,相应的措施根据不同的错误进行处理。
5indeterminate不确定告警的级别不能确定,即告警造成的影响需视实际环境而定。
6cleared清除表示清除一个或多个此前已上报的告警。此级别告警为受管理对象清除所有具有相同告警类型、可能原因和具体问题的告警。多个关联的通告可以通过配置相互关联的通告参数进行删除。

最后修改 July 23, 2024: clearup observability (4b9f5578)