事件¶
观测云提供了一个全面的事件管理和审计平台,允许实时监控和统一查询来自各种来源的事件数据。通过聚合和关联事件,您可以迅速定位异常,并进行高效的数据分析。
在事件这一功能模块下,您可以通过监控器、智能巡检、SLO 等功能模块监控系统异常和服务质量下降等问题。所有监控活动的结果都会生成事件记录,并将这些事件汇集到事件分析模块中,以便进行深入分析和处理。这种一站式的方法确保了您能够全面掌握系统的健康状况,并及时响应可能出现的任何问题。
事件从何而来?¶
- 满足监控器和智能监控配置规则而触发的告警事件;
- 基于配置的智能巡检 触发的全部告警事件;
- 基于配置的 SLO 触发的全部告警事件;
- 基于系统操作触发的审计事件;
- 通过 OpenAPI 写入的自定义事件。
查看事件记录¶
- 查看器 > 未恢复事件查看器:当前工作空间最近 48 小时内持续被触发的全部未恢复事件,即状态为不正常(
df_status !=ok
)的事件。 - 查看器 > 所有事件查看器:包括监控器、智能巡检、SLO、审计事件、OpenAPI 写入自定义事件来源下的所有事件,如触发监控器检测规则的每一条告警记录即为一个事件数据。
- 智能监控:包括所有满足智能监控配置规则而触发的所有事件,触发后产生的每一条告警记录即为一个事件数据。
事件包含内容¶
以触发配置的监控器规则所产生的事件为例,最终事件内容主要包含我们在新建规则 > 事件通知处所填入的内容。
如下图,将事件标题定义为 日志检测-多索引
,在事件内容中填入 DQL 查询语句,并填入变量,观测云将根据实际监测到的数据,自动生成并展示事件记录的最终结果。
当该条规则监测到异常,您可以前往事件 > 事件详情查看到相关的事件内容。
事件字段说明¶
最终的事件记录会包含以下字段:
字段 |
说明 |
---|---|
date / timestamp |
产生时间。单位秒 |
df_date_range |
时间范围。单位秒 |
df_check_range_start |
检测范围开始时间。单位秒 |
df_check_range_end |
检测范围结束时间。单位秒 |
df_issue_start_time |
本轮首次故障发生的时间。单位秒 |
df_issue_duration |
本轮故障的持续时间,单位秒(从 df_issue_start_time 开始到本事件) |
df_source |
事件来源。包括 monitor, user, system, custom, audit |
df_status |
事件状态。包括 ok, info, warning, error, critical, nodata, nodata_ok, nodata_as_ok, manual_ok |
df_sub_status |
事件细节状态(作为 df_status 的补充) |
df_event_id |
事件唯一 ID |
df_title |
标题 |
df_message |
描述 |
- 当
df_source = monitor
时,额外存在以下字段:
字段 |
说明 |
---|---|
df_dimension_tags |
检测纬度标签,如{"host":"web01"} |
df_monitor_id |
告警策略 ID |
df_monitor_name |
告警策略名 |
df_monitor_type |
所属类型:自定义监控事件为 custom ,SLO 事件为 slo ,智能巡检事件固定为 bot_obs |
df_monitor_checker |
执行函数名,如:custom_metric 等 |
df_monitor_checker_sub |
检测阶段:在数据断档检测阶段产生的为 nodata ,在正常检测阶段产生的为 check |
df_monitor_checker_id |
监控器 ID |
df_monitor_checker_name |
监控器名称 |
df_monitor_checker_value |
事件产生时的异常值 |
df_monitor_checker_ref |
监控器关联,只和检测配置的 DQL 语句关联的字段 |
df_monitor_checker_event_ref |
监控器事件关联,只和 df_dimension_tags 和 df_monitor_checker_id 关联的字段 |
df_monitor_ref_key |
自建巡检的关联 Key,用于和自建巡检对应 |
df_event_detail |
事件检测详情 |
df_user_id |
手工恢复时,操作者用户 ID |
df_user_name |
手工恢复时,操作者用户名 |
df_user_email |
手工恢复时,操作者用户邮箱 |
df_exec_mode |
执行模式,可选值。crontab async |
- 当
df_source = audit
时,额外存在以下字段:
字段 | 说明 |
---|---|
df_user_id |
操作者用户 ID |
df_user_name |
操作者用户名 |
df_user_email |
操作者用户邮箱 |
{其他字段} | 根据具体审计数据需求的其他字段 |
- 当
df_source = user
时,额外存在以下字段:
字段 | 说明 |
---|---|
df_user_id |
创建者用户 ID |
df_user_name |
创建者用户名 |
df_user_email |
创建者用户邮箱 |
{其他字段} | 根据用户操作而产生事件的其他字段 |