SLO¶
观测云 SLO 监控围绕各类指标,测试系统服务可用性是否满足目标需要。
概念先解¶
| 名词 | 描述 |
|---|---|
| SLA | 即 Service-Level Agreement,服务等级协议,指系统服务提供者(Provider)对客户(Customer)的服务承诺。您可以对服务商的服务质量 SLA 评分,实时监测服务的达标率。 |
| SLI | 即 Service Level Indicator,测量指标,指选择用于衡量系统稳定性的指标。观测云 SLI 支持基于监控器设定一个或多个测量指标。 |
| SLO | 即 Service Level Objective,观测云进行 SLA 评分处理的最小单元,是一个时间窗口内 SLI 累积成功数的目标。而我们又经常把 SLO 转化为错误预算,用于计算可容忍的错误数,在每一个检测周期内出现异常事件的时间将在可容错时长中扣除。 |
如上图,系统每 5 分钟检测一次异常,每个异常事件的覆盖时间由其实际起止点(开始时间点基于检测时间窗口,结束时间点由事件产生的开始时间+持续时间组成)精确计算。扣费额度为所有异常事件合并后的总覆盖时间(重叠时段仅计一次)。
