跳转至

基础设施变更检测


基础设施变更检测通过持续监控 Kubernetes 资源配置变更(如 YAML 文件修改),结合版本追踪与智能分析,实现合规性检查、故障根因定位及资源使用优化等效果,最终保障集群安全性、稳定性与资源效率。

检测配置

检测频率

检测规则的执行频率。系统默认包含以下频率:

  • 30s
  • 1m
  • 5m(默认显示)
  • 15m
  • 30m
  • 1h
  • 6h

同时支持自定义输入检测频率,格式如:20m(20 分钟)、2h(2 小时)、1d(1 天)。

检测指标

监控多种基础设施类型的指标数据。

  1. 基础设施类型:Deployments、Daemonsets、Services、Cron Jobs、Statefulsets;

  2. 检测对象:

    • 全部:检测工作空间内所有基础对象的最后上报更新时间是否触发阈值。
    • 自定义:通过 wildcard 模糊匹配对象名。

触发条件

配置各告警级别(致命、严重、重要、警告)的触发条件时,系统将依据以下规则进行判断:

当检测对象状态发生任意变更时,立即产生事件。


当变更条件满足正则匹配时,立即产生事件。

例如:定义正则表达式为:

(?=.*CPU)(?=.*\berror\b)

表示若检测对象中产生了与 CPU 相关的错误条目,会立即产生事件数据。


后续配置

完成检测规则配置后,您还需要进行以下相关设置:

  1. 事件通知:自定义事件标题、内容及通知成员。可按需开启自定义通知或关联故障功能,并配置数据断档的处理方式与事件级别;

  2. 告警配置:选择告警策略,以控制告警的触发频率及静默规则;

  3. 关联配置:关联仪表板,以便在可视化界面中查看监控上下文;

  4. 权限设置:配置操作权限,支持自定义或跟随监控器默认权限。

更多详情,可参考 规则配置

事件查看

基于基础设施变更检测触发产生的事件可前往事件 > 变更事件进行查看。

文档评价

文档内容是否对您有帮助? ×