故障详情页¶
故障详情页是用于集中查看和处理单个故障的完整页面,您可以在这里了解故障详情、进行状态操作、分析关联数据,并与团队协作。
故障详情页顶部展示故障的核心信息,包括故障级别(P0/P1/P2 等,由监控器自动设定不可手动修改)、当前状态及开始时间、故障标题、触发时间与持续时长。
状态管理¶
故障初始为 open 状态,您可主动“认领此故障”,认领后状态自动转为 working 并成为处理人。处理人可将故障标记为 resolved 或 closed。只有当前负责人可更改故障状态,其他成员可重新认领 working 的故障以接替处理。页面右侧,系统为您展示处理进度及状态变更、升级通知等关键节点的时间线。
故障详情¶
进入详情页时,默认展示“故障详情 tab” 页。除故障状态等信息外,默认打开页面为您展示当前故障关联的事件错误分布图、异常描述(检测维度、来源、时间内容、补充信息等)。
操作记录¶
在故障详情页中,您可以通过“操作记录”入口查看该故障的完整处理轨迹。系统会按时间倒序清晰展示包括故障触发、状态变更、等级调整、负责人交接以及升级通知执行在内的所有关键操作,帮助您随时掌握最新进展并追溯完整处理过程。
协作记录¶
您可以在当前详情页通过页面下方的评论功能进行团队协作,支持添加文字、链接或上传附件。
所有协作内容将统一汇总至协作记录板块,系统会自动记录包括故障触发、状态变更、操作记录、处理人调整及升级通知在内的完整操作日志,形成清晰的审计线索,便于后续跟踪与复盘。
关联事件¶
在故障详情页的“关联事件”标签页中,系统将集中展示与该故障相关的所有监控事件。这些事件基于相同的检测维度自动关联而来,默认显示故障发生前后最近 2 小时内的数据。
您可以在此查看:
- 事件的发生时间、来源与具体内容
- 事件所关联的检测指标与描述信息
- 事件的分布情况(通过时间柱状图直观呈现)
点击任一事件或分布图中的时间区间,可携带当前筛选条件跳转至对应分析页面,进一步查看详细日志、指标趋势或链路信息,辅助您定位故障根因或评估影响范围。
关联数据分析¶
系统根据故障的检测维度自动关联并展示相关数据,帮助您定位问题:
-
若故障涉及服务,将展示相关错误链路、服务看板、依赖拓扑及日志
-
若涉及应用,将展示错误用户访问列表及对应类型(Web /移动端等)的分析看板
-
若涉及主机,将展示监控指标、错误日志、进程、容器及网络视图
所有数据视图默认聚焦故障发生前后最近 2 小时,您可通过分布图快速了解影响情况,并可点击跳转至对应页面进行深入分析。






