跳转至

错误列表


在左侧导航栏点击“错误中心”,默认为您展示错误列表。列表中的所有错误数据均来自您已配置完成的投递规则

错误投递逻辑

错误中心采用智能聚合机制对错误数据进行统一管理。系统仅处理能够生成唯一标识(issue_id)的错误数据,该标识通过错误指纹和服务上下文组合生成,确保相同错误的持续跟踪。

错误聚合机制

系统通过以下步骤实现错误智能聚合:

1. 错误指纹生成

系统为每条错误生成唯一指纹标识(fingerprint):

  • APM:错误类型(error_type)+ 错误信息(error_message)+ 错误堆栈(error_stack)

  • RUM:错误类型(error_type)+ 错误信息(error_message)+ 错误堆栈(error_stack)

  • Logs (含错误堆栈 error_stack):错误类型(error_type)+ 错误信息(error_message)+ 错误堆栈(error_stack)

  • Logs (不含错误堆栈 error_stack):错误类型(error_type)+ 错误信息(error_message)

错误指纹的生成以数据完整性为前提。APM、RUM、Logs 数据中必须包含以上路径的字段才会生成 fingerprint;若字段缺失,则跳过该条数据。

注意
  • 在计算前,系统会执行标准化处理,自动识别并过滤错误信息(error_message)中的变量内容(如时间戳、用户 ID 等),确保相同逻辑错误的指纹一致。

  • 堆栈信息(error_stack)会进行优化处理,仅保留关键业务调用行;

  • 系统会严格校验字段完整性,缺失必要字段的数据将被排除。

2. 错误问题标识

在错误指纹的基础上,系统会结合错误发生的上下文生成唯一的问题标识(issue_id),用于在错误中心内跟踪和管理该问题。具体生成逻辑如下:

  • APM 错误:服务(service)+ 指纹(fingerprint)
  • RUM 错误:应用名(app_name)+ 指纹(fingerprint)
  • 日志错误:服务(service)+ 指纹(fingerprint)

当系统首次为某个错误组合生成新的 issue_id 时,会自动在工作台中记录该问题的首次出现时间,并开始对其进行全生命周期的状态跟踪与聚合分析。

错误数据存储

错误数据存储在独立命名空间,与原始数据隔离,默认保留 90 天(❗️暂不支持自定义)。每个工作空间每日新增错误问题上限为 10,000 条。

错误中心列表按 issue_id 为您展示聚合结果,包括“全部”来源以及“全部”状态的错误数据。您可切换查看:

  • 错误来源:

    • 日志
    • 应用性能监测
    • 用户访问监测
  • 错误状态:

    • 待分配 (Triage)
    • 已分配 (Assigned)
    • 处理中 (Working)
    • 已解决 (Resolved)
    • 已忽略 (Ignored)
状态变更的特殊场景

当某个已经处于 “Resolved” 状态的错误问题再次出现相同错误时,系统会自动将其状态从 “Resolved” 重置为 (Triage),并重新开始整个处理流程(包括自动通知负责人)。

如果错误处于 (Ignored) 状态,那么即使相同错误再次发生,也不会被重新打开,而是继续保持 (Ignored) 状态。

还可通过应用名称(app_name)、服务(service)、来源(resource)、版本(version)、环境(env)进行筛选搜索定位。

列表展示

在列表页,每条错误数据清晰显示最近发生的错误类型与描述、所属的应用或服务、当前错误处理负责人、最后触发时间及累计次数。数据右侧提供该错误的近期发生趋势图,直观呈现错误的时间分布模式。

更多阅读

文档评价

文档内容是否对您有帮助? ×