告警策略管理¶
概述¶
观测云支持对监控器的检测结果进行告警策略管理,通过发送告警通知邮件或者群消息通知,让您及时了解监测的异常数据情况,发现问题,解决问题。
系统默认的告警策略
- 每个监控器创建时必须选择一个告警策略,默认选中默认;
- 当某个告警策略被删除时,删除告警策略下的监控器将自动归类到默认下。
新建告警策略¶
在观测云工作空间监控 > 告警策略管理,点击新建告警策略即可添加新的告警策略。可以为告警策略配置告警对象和告警沉默。
告警名称:即当前告警策略的名称。
事件通知:
事件等级:包括信息、紧急、重要、警告、无数据、恢复、无数据恢复、无数据视为恢复。
事件等级详情参考 事件等级说明。
通知对象:告警通知支持选择不同的通知类型,对多个对象发送告警通知。包括空间成员、邮件组、钉钉机器人、企业微信机器人、飞书机器人和 Webhook 自定义。
通知类型 | 说明 |
---|---|
空间成员 | 邮件通知,通过在管理 > 成员管理,添加通知对象,可参考此文档中的告警示例。 |
成员组 | 邮件通知,一个成员组可添加多个空间成员,通过在管理 > 成员管理 > 成员组管理,添加通知对象。 |
邮件组 | 邮件通知,一个邮件组可添加多个成员组,通过在监控 > 通知对象管理,添加通知对象。 |
钉钉机器人、企业微信机器人、飞书机器人 | 群通知,通过在监控 > 通知对象管理 ,添加通知对象。 |
Webhook 自定义 | 用户自行设定,通过在监控 > 通知对象管理 ,添加通知对象。 |
短信 | 短信通知,一个短信组可以添加多个空间成员,通过在监控 > 通知对象管理 ,添加通知对象。观测云免费版无短信通知,其他版本短信通知 0.1 元 / 条,按天计费,没有免费额度。 |
您可按需选择和添加事件通知等级和告警通知对象,支持不同级别告警到不同的通知对象;
Attention
- 邮件、钉钉、微信、飞书、短信告警通知都是每分钟合并了发送,并不是产生后立刻发送,会存在约一分钟的延迟;
- 邮件、钉钉、微信、飞书收到的告警通知包含“观测云跳转链接”,点击可直接跳转到对应的观测云事件详情,时间范围为当前时间的往前 15 分钟,即
18:45:00
的事件,点击链接后跳转至事件详情页,时间范围固定为4.20 18:30:00 ~ 4.20 18:45:00
。
沉默周期:若同一个事件不是非常紧急,但是告警通知频率高,可以通过设置告警沉默的方式减少告警通知频率。
注意:告警沉默后事件会继续产生,但是告警通知不会再发送,产生的事件会存入事件管理。
告警策略列表¶
告警策略列表保存有当前工作空间内的全部告警策略。您可以查看告警策略名称、关联监控器、告警沉默时间以及进行其他相关操作。
功能 | 说明 |
---|---|
查询 | 告警策略列表支持基于告警策略名称进行搜索。 |
批量操作 | 您可以选择批量删除特定告警策略。 |
关联监控器 | 展示告警策略下的监控器个数,点击个数可以跳转到监控器查看告警策略下的监控器详情。 |
告警配置 | 点击 可以修改当前告警策略。 |
删除 | 当告警策略被删除时,删除告警策略下的监控器将自动归类到默认下。 您还可以点击名称旁的 ,即可选中特定图表批量删除。 |