跳转至

监控器问题排查

简介

本文将介绍如何排查监控器常见问题:

  • 监控器不产生事件
  • 监控器有事件,但没有推送消息通知

前提条件

  • 需要观测云创建监控器的账号权限
  • 需要观测后台管理权限

排查步骤

步骤一:创建测试监控器

  • 登录观测云控制台
  • 选择「监控」-「新建监控器」-「阈值检测」

  • 检测指标:

M::`cpu`:(COUNT(`usage_guest`)) BY `host`
  • 触发条件:紧急 Result > 0

  • 事件标题:test

  • 事件内容:test

  • 告警策略:选择你设置好的策略

  • 保存

步骤二:获取自动触发配置 ID

  • 登录观测云控制台 选择「监控」- 打开浏览器调试模式

  • 点击监控器名称链接

  • 获取自动触发配置 ID

步骤三:登录 Func 平台查询问题

  • Launcher 获取 Func 登录地址

  • 登录您的 func 平台

  • 「管理」-「自动触发配置」-「选择显示全部」-「输入步骤二的ID」-「确认搜索」-「近期执行」

  • 你可以通过 「近期执行」查看详细报错信息

步骤四:查看告警通知日志排查

注意

建议执行kubectl rollout restart -n middleware deploy message-desk-worker message-desk,再测试排查。

message-desk-worker 服务是观测云告警通知模块,负责发送钉钉机器人通知,邮件通知,飞书机器人通知等。

  • namespace: middleware
  • deployment: message-desk-worker
  • log patch: /logdata/bussiness.log

文档评价

文档内容是否对您有帮助? ×