跳转至

Status Page


观测云提供 Status Page(服务状态页面),您可以在此实时查看各个站点的服务运行状态,以及历史上出现的问题与处理记录。

我们持续监控所有站点的服务状况。一旦发生服务问题,团队将第一时间响应并处理。如果您在使用过程中遇到异常,建议先查看观测云的服务状态,以判断是否因平台服务暂时波动所致。例如,若遇到日志上报失败,可优先检查观测云的日志服务是否正常。

服务站点

进入导航栏帮助 > Status Page

点击订阅按钮,即可开始监测本站点的服务运行状态。订阅后,当服务出现异常时,您将收到邮件通知。

注意

观测云对站点下工作空间的各功能模块执行持续监测:以 1 分钟/次的频率检测,并每 5 分钟汇总结果。任一 5 分钟内出现单次异常即判定该周期为异常;若某模块连续 30 分钟(即连续 6 次汇总)均异常,则将触发告警邮件。首次告警后,若该模块的下一次 5 分钟汇总结果恢复正常,则判定异常事件已结束。

您可以直接点击以下链接查看观测云各个站点的服务状态:

站点 登录地址 URL 运营商
中国区1(杭州) https://auth.guance.com/ 阿里云(中国杭州)
中国区2(宁夏) https://aws-auth.guance.com/ AWS(中国宁夏)
中国区4(广州) https://cn4-auth.guance.com/ 华为云(中国广州)
中国区6(香港) https://cn6-auth.guance.com/ 阿里云(国际站)
美洲区1(俄勒冈) https://us1-auth.guance.com/ AWS(美国俄勒冈)
亚太区1(新加坡) https://ap1-auth.guance.com/ AWS(新加坡)
欧洲区1(法兰克福) https://eu1-auth.guance.com/ AWS(法兰克福)
印尼区1(雅加达) https://id1-auth.guance.com/ 腾讯云(雅加达)
非洲区1(南非) https://za1-auth.guance.com/ 华为云(南非)
中东区1(阿联酋) https://me1-auth.guance.com/ AWS(阿联酋)

服务状态

各站点服务可能存在以下几种状态:

服务状态 状态说明
正常 表示当前站点的服务正常工作,数据断档丢失
异常 表示当前站点的服务发生异常,存在数据丢失的可能
延迟 表示当前站点的服务发生延时,数据断档丢失,查询数据延迟
维护 表示观测云技术人员正在对当前站点进行维护

异常/延迟判断逻辑

在 Status Page,您可以查看包括事件、基础实施、用户访问监测、应用性能监测、指标、日志、可用性监测、CI 可视化等关键功能模块的状态。

Status Page 基于以上的数据处理过程,在数据处理和数据存储这两个过程进行服务状态的判断,如下表所示:

判断项
判断条件 服务状态 示例说明
数据推送失败率 大于 90% 异常 采集日志数据,从 Kodo 推送数据到消息队列的失败率大于 90%,此时日志服务的状态为异常
数据入库失败率 大于 90% 异常 采集日志数据,从 Kodo-x 写入数据库的失败率大于 90%,此时日志服务的状态为异常
消息订阅延迟 P99 大于 5 分钟 延迟 采集应用性能数据,消息队列发送到 Kodo-x 的数据延迟 P99 超过 5 分钟,此时应用性能监测服务的状态为延迟

管理服务状态

在服务状态页面,您可以:

  • 点击各服务站点链接,切换查看对应的服务状态;

  • 实时刷新服务状态;

  • 查看事件、基础实施、用户访问监测、应用性能监测、指标、日志、可用性监测、CI 功能模块的当前状态和最近 24 小时状态;

  • 切换查看历史事故

历史事故

在历史事故页面,您可以:

  • 查看每月发生的所有服务故障;

  • 切换查看服务状态。

文档评价

文档内容是否对您有帮助? ×