跳转至

监控器问题排查

简介

本文将介绍如何排查监控器常见问题:

  • 监控器不产生事件
  • 监控器有事件,但没有推送消息通知

前提条件

  • 需要观测云创建监控器的账号权限
  • 需要观测后台管理权限

排查步骤

步骤一:登录 Func 平台查询问题

  • Launcher 获取 Func 登录地址

  • 登录您的 func 平台(系统内置登录)

账号可咨询观测云工单。

步骤二:查看 Func woker 队列是否阻塞

  • 查看总览,查看 worker-8、worker-9 是否负载过高,或是工作队列过长

解决方案:

  • 增加 worker-8、worker-9 的副本数,如果工作队列依然阻塞,请继续一下步骤排查问题

注意:worker-8 副本数扩大,需注意对日志引擎和时序引擎的查询压力。

步骤三:创建测试监控器

  • 登录观测云控制台
  • 选择「监控」-「新建监控器」-「阈值检测」

  • 检测指标:

M::`cpu`:(COUNT(`usage_guest`)) BY `host`
  • 触发条件:紧急 Result > 0

  • 事件标题:test

  • 事件内容:test

  • 告警策略:选择你设置好的策略

  • 保存

步骤四:获取自动触发配置 ID

  • 登录观测云控制台,选择「监控」- 点击监控器名称链接,获取自动触发配置 ID

步骤五:修改 FUNC 系统设置

  • 打开系统设置,启用「本地函数任务记录」

步骤六:查询 FUNC 执行记录

  • 「管理」-「自动触发配置」-「选择显示全部」-「输入步骤四的ID」-「确认搜索」

  • 配置自动触发,设置「任务记录 保留」,可设置 20

  • 手动触发检测

  • 你可以通过 「近期执行」查看详细报错信息

步骤七:恢复配置

  • 禁用 「本地函数任务记录」
  • 恢复默认「任务记录 保留」

文档评价

文档内容是否对您有帮助? ×