跳转至

开始使用监控器

监控器是由用户自定义配置的自动化检测工具,通过实时采集基础设施、应用性能或日志等不同类型的数据,在满足预设规则时触发告警并生成详细事件记录

观测云提供完善的异常监测体系,内置 700+ 开箱即用的监控模板,支持十余种检测规则。通过灵活设置检测规则与关联告警通知,助力迅速实现从问题发现、定位到解决的全流程闭环。

开始使用

官方模板:基于行业最佳实践和常见场景设计,观测云内置一系列专业化的预置监控器模板,覆盖常见技术栈与业务组件的关键性能指标及推荐阈值。这些模板帮助您快速建立符合业务场景的监控体系,有效降低初始配置复杂度

自定义检测规则:通过配置阈值检测、突变检测、区间检测等十余种检测规则,自定义监控器的触发条件,并在开启后接收异常事件告警。适用于官方模板未覆盖的个性化监控场景

自定义模板库:针对团队协作场景,观测云支持复用工作空间内已有的监控器配置。您可选择现有创建的监控器作为模板,仅需调整检测规则、告警条件等必要参数,即可快速生成结构一致的新监控器,减少重复配置工作

更多详情,可参考 监控器

快速创建

示例一:使用官方模板(推荐新手)

以下以通过官方模板创建主机 CPU 监控器为例:

  1. 进入监控 > 新建监控器 > 官方模板库
  2. 在左侧检测库筛选主机检测库
  3. 在筛选列表中选择 主机 {{ host }} CPU 平均负载过高
  4. 保存。

系统会自动创建监控器,并关联对应的告警策略。当主机 CPU 平均负载超过预设阈值时,将生成事件并触发告警。

示例二:自定义检测规则

  1. 进入监控 > 监控器 > 新建监控器;

  2. 选择检测规则(此处选择阈值监测),进入配置页面

检测配置

  1. 设置检测频率为 ”1 分钟“;

  2. 选择检测区间为“最近 1 分钟”;

  3. 选择检测指标,此处设置查询条件为:

    M::`kube_pod`:(last(`cpu_usage_base100`)) BY `cluster_name_k8s`, ` pod_name`
    
  4. 设置触发条件:当查询结果大于 95%,即触发级别为“严重”的事件。

注意

同时配置触发条件、数据断档、信息生成时,按照如下优先级判断触发:数据断档 > 触发条件 > 信息事件生成。

事件通知

  1. 输入事件标题;

  2. 定义事件通知内容。

告警配置

选择是否要关联告警策略。监控满足触发条件后,立即发送告警消息给指定的通知对象。

此处示例中不选择告警策略。

关联

将监控器与仪表板关联,以便快速跳转,可视化查看相关数据。

此处示例中不选择关联。

权限

设置监控器的操作权限后,确保不同用户根据其角色和权限级别进行符合配置的操作。

此处示例中不配置权限。

查看监控器

创建检测规则后,您可在监控器列表中查看该规则。此后,该规则触发的所有异常事件将展示在事件中心

文档评价

文档内容是否对您有帮助? ×