跳转至

管理 SLO


所有已创建的 SLO 任务均可前往监控器 > SLO进行查看,列表实时展示关联监控器、目标、故障时间、达标率、错误预算等指标,并支持启用、禁用、编辑、查看事件、导出仪表板。

列表字段

字段
说明
监控器 SLI 关联的监控器数量,即测量服务性能的指标。
目标 创建 SLO 任务时设定的服务可用性的目标百分比。
达标率(7天) 在给定考核周期内满足系统无异常时间占总时长的百分比(达标率=系统无异常时间/考核周期 * 100%):
  • 当最低目标百分比 =< 百分比 < 目标百分比时,被认定 SLA 不健康,显示为橙色达标率;
  • 当百分比 < 最低目标百分比时,被认定 SLA 不达标,显示为红色达标率。
  • 故障时间(7天) 即监控器异常的时间/已用额度。
    错误预算(7天) 当前 SLO 还剩余的可容错时长(假设目标 SLO 设定为 95%,即存在 5% 的容错率,默认最近 7 天为周期,即默认:错误预算=7天 *5% = 21分钟),显示为:
  • 绿色:剩余的可容错时长 >= 0;
  • 红色:剩余的可容错时长 < 0。
  • 操作说明

    • 搜索:按 SLO 名称过滤;
    • 批量:启用/禁用/删除多选 SLO;
    • 单条 SLO 任务:启用、禁用、编辑(限非名称/目标/频率)、删除;
    • 删除:支持删除已有的 SLO 任务;
    • 查看相关事件:一键查看该 SLO 触发的全部未恢复事件;
    • 导出到仪表板:将 SLO 视图同步到仪表板。
    注意
    • 删除 SLO 会同步删除其仪表板视图;
    • 仪表板中的 SLO 视图的时间范围默认与仪表板保持一致,列表默认显示近 7 天达标率。

    通过 DQL 表达式获取 SLO

    异常时间参考如下查询:

    df_slo_cost 表示扣除分钟数,将值相加即为异常时间df_slo_id 对应替换即可:

    E::`slo`:(sum(`df_slo_costslo_cost`)) { `df_slo_id` = 'monitor_6bad2a76dd9b41d7894f21a76d44ae42' }
    

    若查询 7 天的 SLO 值,DQL 表达式如下:

    eval((10080-A)/10080 *100, A="E::`slo`:(sum(`df_slo_cost`)) { `df_slo_id` = 'monitor_6bad2a76dd9b41d7894f21a76d44ae42'}")
    

    示例:

    下图中 SLO 任务过去 7 天的异常时间 SLO 值为 80.496%

    前往快捷入口 > 查询工具,选择 DQL 查询,输入 7 天 SLO 值的查询语句,查询结果与上图的值一致。

    注意

    在应用查询工具 > DQL 查询时,需保证右上角时间范围与获取 SLO 值的时间范围一致;slo_id 可前往事件 > 事件详情页查看:

    文档评价

    文档内容是否对您有帮助? ×