错误列表¶
在左侧导航栏点击“错误中心”,默认为您展示错误列表。列表中的所有错误数据均来自您已配置完成的投递规则。
错误投递逻辑¶
错误中心采用智能聚合机制对错误数据进行统一管理。系统仅处理能够生成唯一标识(issue_id)的错误数据,该标识通过错误指纹和服务上下文组合生成,确保相同错误的持续跟踪。
错误聚合机制¶
系统通过以下步骤实现错误智能聚合:
1. 错误指纹生成
系统为每条错误生成唯一指纹标识(fingerprint):
-
APM:
错误类型(error_type)+ 错误信息(error_message)+ 错误堆栈(error_stack) -
RUM:
错误类型(error_type)+ 错误信息(error_message)+ 错误堆栈(error_stack) -
Logs (含
错误堆栈 error_stack):错误类型(error_type)+ 错误信息(error_message)+ 错误堆栈(error_stack) -
Logs (不含
错误堆栈 error_stack):错误类型(error_type)+ 错误信息(error_message)
错误指纹的生成以数据完整性为前提。APM、RUM、Logs 数据中必须包含以上路径的字段才会生成 fingerprint;若字段缺失,则跳过该条数据。
注意
-
在计算前,系统会执行标准化处理,自动识别并过滤错误信息(
error_message)中的变量内容(如时间戳、用户 ID 等),确保相同逻辑错误的指纹一致。 -
堆栈信息(
error_stack)会进行优化处理,仅保留关键业务调用行; -
系统会严格校验字段完整性,缺失必要字段的数据将被排除。
2. 错误问题标识
在错误指纹的基础上,系统会结合错误发生的上下文生成唯一的问题标识(issue_id),用于在错误中心内跟踪和管理该问题。具体生成逻辑如下:
- APM 错误:
服务(service)+ 指纹(fingerprint) - RUM 错误:
应用名(app_name)+ 指纹(fingerprint) - 日志错误:
服务(service)+ 指纹(fingerprint)
当系统首次为某个错误组合生成新的 issue_id 时,会自动在工作台中记录该问题的首次出现时间,并开始对其进行全生命周期的状态跟踪与聚合分析。
错误数据存储¶
错误数据存储在独立命名空间,与原始数据隔离,默认保留 90 天(❗️暂不支持自定义)。每个工作空间每日新增错误问题上限为 10,000 条。
错误中心列表按 issue_id 为您展示聚合结果,包括“全部”来源以及“全部”状态的错误数据。您可切换查看:
-
错误来源:
- 日志
- 应用性能监测
- 用户访问监测
-
错误状态:
- 待分配 (Triage)
- 已分配 (Assigned)
- 处理中 (Working)
- 已解决 (Resolved)
- 已忽略 (Ignored)
状态变更的特殊场景
当某个已经处于 “Resolved” 状态的错误问题再次出现相同错误时,系统会自动将其状态从 “Resolved” 重置为 (Triage),并重新开始整个处理流程(包括自动通知负责人)。
如果错误处于 (Ignored) 状态,那么即使相同错误再次发生,也不会被重新打开,而是继续保持 (Ignored) 状态。
还可通过应用名称(app_name)、服务(service)、来源(resource)、版本(version)、环境(env)进行筛选搜索定位。
列表展示¶
在列表页,每条错误数据清晰显示最近发生的错误类型与描述、所属的应用或服务、当前错误处理负责人、最后触发时间及累计次数。数据右侧提供该错误的近期发生趋势图,直观呈现错误的时间分布模式。
