监控器问题排查¶
简介¶
本文将介绍如何排查监控器常见问题:
- 监控器不产生事件
- 监控器有事件,但没有推送消息通知
前提条件¶
- 需要观测云创建监控器的账号权限
- 需要观测后台管理权限
排查步骤¶
步骤一:创建测试监控器¶
- 登录观测云控制台
-
选择「监控」-「新建监控器」-「阈值检测」
-
检测指标:
-
触发条件:紧急 Result > 0
-
事件标题:test
-
事件内容:test
-
告警策略:选择你设置好的策略
-
保存
步骤二:获取自动触发配置 ID¶
- 登录观测云控制台 选择「监控」- 打开浏览器调试模式
- 点击监控器名称链接
- 获取自动触发配置 ID
步骤三:登录 Func 平台查询问题¶
- 登录您的 func 平台
- 「管理」-「自动触发配置」-「选择显示全部」-「输入步骤二的ID」-「确认搜索」-「近期执行」
- 你可以通过 「近期执行」查看详细报错信息
步骤四:查看告警通知日志排查¶
注意
建议执行kubectl rollout restart -n middleware deploy message-desk-worker message-desk
,再测试排查。
message-desk-worker 服务是观测云告警通知模块,负责发送钉钉机器人通知,邮件通知,飞书机器人通知等。
- namespace: middleware
- deployment: message-desk-worker
- log patch: /logdata/bussiness.log