跳转至

Kubernetes 智能检测


基于智能检测算法,通过定期监控关键指标,如 Pod 总数、Pod 重启次数以及 API Server QPS 等,Kubernetes 智能检测能够及时发现并预测集群中可能出现的问题。这种方法不仅能识别出资源使用的异常波动,还能通过根因分析精确指出问题源头,无论是配置失误、资源不匹配还是请求过多。使 Kubernetes 集群的运维工作更加智能化和自动化。

应用场景

对集群的各项性能指标深入洞察,从集群资源、服务资源到 API server 层面提供全方位的监控能力。

检测配置

  1. 定义监控器名称;

  2. 选择检测范围:基于集群、命名空间和主机进行筛选,限定检测的数据范围。支持添加一个或多个标签筛选。若不添加筛选,检测所有指标数据。

查看事件

监控器会获取最近 10 分钟的检测应用程序服务对象指标信息,识别出现异常情况时,会生成相应的事件,在事件 > 智能监控列表可查看对应异常事件。

事件详情页

点击事件,可查看智能监控事件的详情页,包括事件状态、异常发生时间、异常名称、分析报告、告警通知、历史记录和关联事件。

  • 点击右上角的跳转到监控器,可查看调整智能监控器配置

  • 点击右上角的导出按钮,支持选择导出 JSON 文件导出 PDF 文件,从而获取当前事件所对应的所有关键数据。

分析报告

  • 异常总结:显示查看当前集群异常 APIServer 节点数分布情况统计。

  • 异常分析:可查看 APIServer 节点数、API QPS、在处理读请求数量、写请求成功率、在处理写请求数量等信息。

扩展字段

告警通知

关联事件

文档评价

文档内容是否对您有帮助? ×