跳转至

应用智能检测


应用智能检测基于智能检测算法,智能识别应用请求数量的突增 / 突降、错误请求数量的突增、请求延迟的突增 / 突降 / 区间上升等异常情况,通过应用程序服务异常指标来自动进行异常分析。

应用场景

用于监控应用程序服务是否出现异常或中断,确保服务平稳运行状态。

新建

点击智能监控 > 新建智能监控 > 应用智能检测,进入规则的配置页面。

步骤一:检测配置

image

1)监控器名称:支持编辑监控器名称。

2)检测范围:基于指标的标签对检测指标的数据进行筛选,限定检测的数据范围,支持添加一个或多个标签筛选。若不添加筛选,检测所有指标数据。

步骤二:事件通知

image

1)事件内容:满足触发条件时发送的事件通知内容。支持输入 Markdown 格式文本信息并预览效果,支持使用预置的关联链接和模板变量

注意:不同告警通知对象支持的 Markdown 语法不同,例如:企业微信不支持无序列表。

2)关联异常追踪:开启关联后,若该监控器下产生了异常事件,将同步创建 Issue。选择 Issue 的等级以及需要投递的目标频道,产生的 Issue 可以前往异常追踪 > 您选定的频道进行查看。

在事件恢复后,可以同步关闭 Issue。

事件内容自定义高级配置

观测云支持在事件内容中通过高级配置添加关联日志或错误堆栈,以便查看异常情况发生时的上下文数据情况:

  • 添加关联日志:

查询:

如:获取一条索引为 default 的日志 message

{% set dql_data = DQL("L::RE(`.*`):(`message`) { `index` = 'default' } LIMIT 1") %}

关联日志:

{{ dql_data.message | limit_lines(10) }}
  • 添加关联错误堆栈

查询:

{% set dql_data = DQL("T::re(`.*`):(`error_message`,`error_stack`){ (`source` NOT IN ['service_map', 'tracing_stat', 'service_list_1m', 'service_list_1d', 'service_list_1h', 'profile']) AND (`error_stack` = exists()) } LIMIT 1") %}

关联错误堆栈:

{{ dql_data.error_message | limit_lines(10) }}

{{ dql_data.error_stack | limit_lines(10) }}

步骤三:告警配置

告警策略:监控满足触发条件后,立即发送告警消息给指定的通知对象。告警策略中包含需要通知的事件等级、通知对象、以及告警沉默周期。

告警策略支持单选或多选,点击策略名可展开详情页。若需修改策略点击编辑告警策略即可。

查看事件

监控器会获取最近 10 分钟的检测应用程序服务对象指标信息,识别出现异常情况时,会生成相应的事件,在事件 > 智能监控列表可查看对应异常事件。

image

事件详情页

点击事件,可查看智能监控事件的详情页,包括事件状态、异常发生时间、异常名称、分析报告、告警通知、历史记录和关联事件。

  • 点击右上角的跳转到监控器,可查看调整智能监控器配置

  • 点击右上角的导出按钮,支持选择导出 JSON 文件导出 PDF 文件,从而获取当前事件所对应的所有关键数据。

分析报告

  • 异常总结:显示查看当前异常应用程序服务标签、异常分析报告详情、异常值分布情况统计

  • 资源分析:对请求数的监控,可查看资源请求数排行(TOP 10)、资源错误请求数排行(TOP 10)、资源每秒请求数排行(TOP 10)等信息

注意:存在多个区间异常时,异常分析仪表板默认展示第一段异常区间的异常情况,可以点击【异常值分布图】进行切换,切换后异常分析仪表板同步联动。

扩展字段

告警通知

关联事件

文档评价

文档内容是否对您有帮助? ×