常见问题¶
监控器可以分享给他人使用吗?
可以。
在监控器列表,您可以通过导出或导入监控器两个功能实现共享。
如何理解静默规则中的【事件属性】?
当监控器产生异常事件,会发送告警通知。此时,支持基于事件维度进行告警静默:
在设置静默规则时,可以配置事件属性,即为当前静默规则设定标签。比如,四台主机 A、B、C、D 均产生异常事件,但若不想接收来自主机 C 的告警通知,则可以在事件属性中填入 host:C
。此时,当监控器捕捉到异常事件告警,会针对已配置的属性过滤筛选,仅发送主机 A、B、D 的告警通知。
为什么配置了 3 分钟无数据告警,但经常触发告警误报?
如果使用了“基础设施存活检测”类型的监控器规则,当前观测云是通过检测基础设施对象数据的上报(或更新时间)来判断其是否处于存活状态。例如,已知基础设施对象的上报频率为每 5 分钟一次,这意味着数据更新的时间间隔为 5 分钟。如果在此场景下将检测频率配置为每 1 分钟一次,并设置 “3 分钟无数据即触发告警”的规则,则可能会误触发不符合预期的告警。
对于此类检测频率较高的场景,建议优先使用上报频率更高的指标数据进行存活检测。当前可以通过配置阈值检测来实现相关需求。
配置告警策略时,一个规则怎么配置多个过滤条件?
一个规则下只能添加一组过滤条件,但是过滤条件中可以添加多个 key:value
匹配的过滤规则。因此只需点击过滤规则的输入域添加多个条件即可,添加完成后点击输入域可查看规则。
标签:新建监控器时,在事件内容中添加 {{df_label}}
变量,但该监控器最终产生的事件记录中,此标签 df_label
内容为空。
事件 > 内容详情 > 扩展字段中的 df_label
为系统字段。监控器 > 事件内容中添加的变量与该系统字段产生冲突时,会作丢弃处理,最终只展示事件下的 df_label
字段。