管理 SLO¶
所有已创建的 SLO 任务均可前往监控器 > SLO进行查看,列表实时展示关联监控器、目标、故障时间、达标率、错误预算等指标,并支持启用、禁用、编辑、查看事件、导出仪表板。
列表字段¶
字段 |
说明 |
---|---|
监控器 | SLI 关联的监控器数量,即测量服务性能的指标。 |
目标 | 创建 SLO 任务时设定的服务可用性的目标百分比。 |
达标率(7天) | 在给定考核周期内满足系统无异常时间占总时长的百分比(达标率=系统无异常时间/考核周期 * 100%): |
故障时间(7天) | 即监控器异常的时间/已用额度。 |
错误预算(7天) | 当前 SLO 还剩余的可容错时长(假设目标 SLO 设定为 95%,即存在 5% 的容错率,默认最近 7 天为周期,即默认:错误预算=7天 *5% = 21分钟),显示为: |
操作说明¶
- 搜索:按 SLO 名称过滤;
- 批量:启用/禁用/删除多选 SLO;
- 单条 SLO 任务:启用、禁用、编辑(限非名称/目标/频率)、删除;
- 删除:支持删除已有的 SLO 任务;
- 查看相关事件:一键查看该 SLO 触发的全部未恢复事件;
- 导出到仪表板:将 SLO 视图同步到仪表板。
注意
- 删除 SLO 会同步删除其仪表板视图;
- 仪表板中的 SLO 视图的时间范围默认与仪表板保持一致,列表默认显示近 7 天达标率。
通过 DQL 表达式获取 SLO¶
异常时间参考如下查询:
df_slo_cost
表示扣除分钟数,将值相加即为异常时间,df_slo_id
对应替换即可:
若查询 7 天的 SLO 值,DQL 表达式如下:
eval((10080-A)/10080 *100, A="E::`slo`:(sum(`df_slo_cost`)) { `df_slo_id` = 'monitor_6bad2a76dd9b41d7894f21a76d44ae42'}")
示例:
下图中 SLO 任务过去 7 天的异常时间 SLO 值为 80.496%
。
前往快捷入口 > 查询工具,选择 DQL 查询,输入 7 天 SLO 值的查询语句,查询结果与上图的值一致。