常见问题¶
故障列表¶
为什么有些故障显示“未知”等级?
可能原因:
- 监控器未配置等级映射
- 默认等级被禁用且未配置自定义等级
- 智能监控自动发现的异常未关联等级
故障可以删除吗?
故障不支持删除,只能关闭。这是为了保证审计追踪的完整性。
为什么相同问题会产生多个故障?
系统会基于检测维度自动合并相同告警。如果检测维度不同(如不同主机、不同服务),则会生成独立故障。
故障详情¶
为什么认领后还在收到通知?
可能原因:
- 认领后故障再次触发(Resolved 后复发)
- 多个值班规则匹配了该故障,其他规则仍在通知
- 升级策略的重复通知已开启
可以修改故障的检测维度吗?
不可以。检测维度由监控器自动生成,是故障的核心标识。
如何查看故障是否已通知了哪些人?
在“操作记录”中查看,系统会记录每次通知的发送对象和方式。
故障可以合并吗?
系统会自动合并相同检测维度的告警到同一故障。不同维度的故障不支持手动合并。
值班¶
为什么故障产生了但值班人没收到通知?
排查步骤:
- 检查故障标签是否与值班规则匹配;
- 检查当前时间是否在值班生效时间段内;
- 检查值班人是否配置了联系方式;
- 检查值班人状态是否为“休假中”。
多个值班规则匹配了同一个故障会怎样?
所有匹配的值班规则都会收到通知。如果这不是预期行为,需要调整标签匹配逻辑,确保互斥。
升级策略可以应用到特定故障等级吗?
可以。在等级配置中,可以指定适用的故障等级(P0/P1/P2)。建议为 P0 配置更激进的升级策略(短等待时间+电话通知),为 P2 配置较宽松的策略。
值班规则可以临时调整吗?
可以编辑或删除值班规则。编辑后,新产生的故障按新规则执行,已存在的故障按原规则继续执行。
值班轮换的周期有哪些选项?
目前支持每天、每周、每月轮换,也支持自定义天数。轮换顺序按照值班人列表的先后顺序循环。
跨天值班时,升级策略的等待时间会重置吗?
不会重置。故障的持续时间是连续计算的,但通知对象会切换到新值班人,并按新值班人的规则继续执行后续通知。例如,故障在 A 值班时触发了 Level 1,跨天后进入 Level 2,则 Level 2 的通知将发给 B 值班的相关人员。