Status Page¶
观测云提供 Status Page(服务状态页面),您可以在此实时查看各个站点的服务运行状态,以及历史上出现的问题与处理记录。
我们持续监控所有站点的服务状况。一旦发生服务问题,团队将第一时间响应并处理。如果您在使用过程中遇到异常,建议先查看观测云的服务状态,以判断是否因平台服务暂时波动所致。例如,若遇到日志上报失败,可优先检查观测云的日志服务是否正常。
服务站点¶
进入导航栏帮助 > Status Page:
点击订阅按钮,即可开始监测本站点的服务运行状态。订阅后,当服务出现异常时,您将收到邮件通知。
注意
观测云对站点下工作空间的各功能模块执行持续监测:以 1 分钟/次的频率检测,并每 5 分钟汇总结果。任一 5 分钟内出现单次异常即判定该周期为异常;若某模块连续 30 分钟(即连续 6 次汇总)均异常,则将触发告警邮件。首次告警后,若该模块的下一次 5 分钟汇总结果恢复正常,则判定异常事件已结束。
您可以直接点击以下链接查看观测云各个站点的服务状态:
| 站点 | 登录地址 URL | 运营商 |
|---|---|---|
| 中国区1(杭州) | https://auth.guance.com/ | 阿里云(中国杭州) |
| 中国区2(宁夏) | https://aws-auth.guance.com/ | AWS(中国宁夏) |
| 中国区4(广州) | https://cn4-auth.guance.com/ | 华为云(中国广州) |
| 中国区6(香港) | https://cn6-auth.guance.com/ | 阿里云(国际站) |
| 美洲区1(俄勒冈) | https://us1-auth.guance.com/ | AWS(美国俄勒冈) |
| 亚太区1(新加坡) | https://ap1-auth.guance.com/ | AWS(新加坡) |
| 欧洲区1(法兰克福) | https://eu1-auth.guance.com/ | AWS(法兰克福) |
| 印尼区1(雅加达) | https://id1-auth.guance.com/ | 腾讯云(雅加达) |
| 非洲区1(南非) | https://za1-auth.guance.com/ | 华为云(南非) |
| 中东区1(阿联酋) | https://me1-auth.guance.com/ | AWS(阿联酋) |
服务状态¶
各站点服务可能存在以下几种状态:
| 服务状态 | 状态说明 |
|---|---|
| 正常 | 表示当前站点的服务正常工作,数据断档丢失 |
| 异常 | 表示当前站点的服务发生异常,存在数据丢失的可能 |
| 延迟 | 表示当前站点的服务发生延时,数据断档丢失,查询数据延迟 |
| 维护 | 表示观测云技术人员正在对当前站点进行维护 |
异常/延迟判断逻辑¶
在 Status Page,您可以查看包括事件、基础实施、用户访问监测、应用性能监测、指标、日志、可用性监测、CI 可视化等关键功能模块的状态。
Status Page 基于以上的数据处理过程,在数据处理和数据存储这两个过程进行服务状态的判断,如下表所示:
判断项 |
判断条件 | 服务状态 | 示例说明 |
|---|---|---|---|
| 数据推送失败率 | 大于 90% | 异常 | 采集日志数据,从 Kodo 推送数据到消息队列的失败率大于 90%,此时日志服务的状态为异常 |
| 数据入库失败率 | 大于 90% | 异常 | 采集日志数据,从 Kodo-x 写入数据库的失败率大于 90%,此时日志服务的状态为异常 |
| 消息订阅延迟 P99 | 大于 5 分钟 | 延迟 | 采集应用性能数据,消息队列发送到 Kodo-x 的数据延迟 P99 超过 5 分钟,此时应用性能监测服务的状态为延迟 |
管理服务状态¶
在服务状态页面,您可以:
-
点击各服务站点链接,切换查看对应的服务状态;
-
实时刷新服务状态;
-
查看事件、基础实施、用户访问监测、应用性能监测、指标、日志、可用性监测、CI 功能模块的当前状态和最近 24 小时状态;
-
切换查看历史事故。
历史事故¶
在历史事故页面,您可以:
-
查看每月发生的所有服务故障;
-
切换查看服务状态。



