故障列表¶
故障列表是观测云中集中管理并展示所有故障的统一页面,用于查看、认领和跟踪故障的处理进展。
故障来源与状态¶
所有故障由监控器在检测到异常时自动创建。故障初始状态为 open,系统将根据您配置的值班规则通知对应人员。您可主动认领故障,认领后状态将自动更新为working,您即成为该故障的负责人。处理完成后,您可将故障手动标记为resolved 或 closed。
列表中每条故障为您展示以下信息:故障标题、描述、影响维度、关联的值班信息与关键时间点(例如 “15 分钟前触发了新的故障”),以及故障已持续的时长。
故障产生后,系统会自动通知当前值班人员。若故障长时间未被认领或处理,将根据您设置的升级策略,自动通知更多或更高级别人员,确保告警必达。
列表相关操作¶
在故障列表,您可进行以下操作:
- 依据标签、状态、等级、值班快速筛选;
- 基于故障名称搜索定位;
- 在时间控件筛选故障产生、更新时间范围等;
- 进入详情页,进行故障认领、评论等操作。
