基础设施变更检测¶
基础设施变更检测通过持续监控 Kubernetes 资源配置变更(如 YAML 文件修改),结合版本追踪与智能分析,实现合规性检查、故障根因定位及资源使用优化等效果,最终保障集群安全性、稳定性与资源效率。
检测配置¶
检测频率¶
检测规则的执行频率。系统默认包含以下频率:
- 30s
- 1m
- 5m(默认显示)
- 15m
- 30m
- 1h
- 6h
同时支持自定义输入检测频率,格式如:20m(20 分钟)、2h(2 小时)、1d(1 天)。
检测指标¶
监控多种基础设施类型的指标数据。
-
基础设施类型:Deployments、Daemonsets、Services、Cron Jobs、Statefulsets;
-
检测对象:
- 全部:检测工作空间内所有基础对象的最后上报更新时间是否触发阈值。
- 自定义:通过 wildcard 模糊匹配对象名。
触发条件¶
配置各告警级别(致命、严重、重要、警告)的触发条件时,系统将依据以下规则进行判断:
后续配置¶
完成检测规则配置后,您还需要进行以下相关设置:
-
事件通知:自定义事件标题、内容及通知成员。可按需开启自定义通知或关联故障功能,并配置数据断档的处理方式与事件级别;
-
告警配置:选择告警策略,以控制告警的触发频率及静默规则;
-
关联配置:关联仪表板,以便在可视化界面中查看监控上下文;
-
权限设置:配置操作权限,支持自定义或跟随监控器默认权限。
更多详情,可参考 规则配置。
事件查看¶
基于基础设施变更检测触发产生的事件可前往事件 > 变更事件进行查看。