跳转至

更新日志(2025 年)


本文档记录观测云每次上线发布的更新内容说明。

2025 年 9 月 24 日

功能更新

Open API

  1. 针对当前新建工作空间新增指定的创建 API Key 权限;
  2. 新增支持绑定指定费用中心;
  3. 新增支持跨工作空间授权。

安全监测

  1. 新增 CSPM 检测类型,支持根据实际业务场景(如云端资源防护、合规审计等)自定义选择检测类型,丰富检测覆盖场景。检测类型说明如下:

    • CSPM(云安全态势管理):识别云基础设施中的错误配置(如开放高危端口、权限过度分配)与合规风险,持续评估云资源安全性,降低漏洞被利用风险。

    • SIEM(安全事件管理):收集和分析来自整个基础设施的安全数据,通过关联事件和日志分析来检测威胁和异常活动(如异常登录 + 数据批量导出)。

  2. 官方检测库体验升级:检测规则新增“所属检测库”标识,便于用户快速识别规则来源;同时支持在模板库中切换查看,可一次性浏览包含监控器在内的所有检测规则,提升规则查找效率。

  3. 安全检测规则编辑体验优化:新增 “立即触发检测” 功能,无需等待定时检测周期,可实时触发检测任务,便于用户在编写/调整检测脚本后,快速验证脚本有效性,并即时查看生成的安全信号。

管理

  1. 新增偏好设置,可对工作空间语言、主题模式、详情页的打开方式等进行统一配置;
  2. 成员管理:新增支持导出成员;
  3. 邀请成员:新增配置成员所属团队和备注信息。

监控

  1. 监控器:编辑监控器规则时支持“立即触发检测”;

    • 突变检测、区间检测 V2 支持跨空间查询
  2. 静默规则支持克隆。

APM

服务列表页新增“添加服务”按钮。

可用性拨测

新建拨测任务时支持通过输入自定义 crontab 配置任务执行频率。

异常追踪

首次自动发现或手动创建 Issue 时,系统支持 AI 智能分析,自动总结当前 Issue 内容。

指标

生成指标:支持基础设施、资源目录数据源。

视图变量

去除原有的 all values 选项,统一通过 * 实现多场景筛选需求,支持根据不同的业务场景选择性使用,具体效果如下:

  • 忽略此字段筛选: 选中 * 时,忽略此字段筛选,图表查询不会包含该变量的过滤条件
  • 全量值筛选(等同原 all values): 选中 * 时,所有变量值将作为筛选条件(最多支持 100 个值)。注意:数据过多可能影响性能,建议根据实际需求选择性使用,避免无差别全量筛选。。

查看器

  1. 日志查看器:索引样式调整,同时支持一键选中全部索引、置顶索引、依据索引名称进行搜索定位等操作;
  2. 所有查看器:支持高级联动配置
  3. 新增查询加速配置,可在查看器“全局配置”中为常用的筛选字段配置索引,提升该字段的查询速度。

时间控件

新增支持快捷缩放功能:一键将当前查询的时间范围扩大至原来的 3 倍,减少手动调整时间范围的操作步骤,提升数据探索的效率。

外部数据源

新增支持 SQL Server 数据源。

新增集成

  1. 新增 AWS AOSS 集成;
  2. 新增 AWS PCS 集成;
  3. 新增阿里云 CEN 集成;
  4. 新增 Continuous Profiler JVM 仪表板模版(分析 Profile 数据);
  5. 新增 AWS WAF 集成;
  6. 新增 FastDFS 集成;
  7. 新增阿里云 API Gateway 集成;
  8. 新增阿里云云防火墙集成;
  9. 翻译 AWS AOSS/AWS PCS 视图。

Bug 修复

  1. 修复了通过中心 Pipeline 对事件内容中的 df_label 新增标签的问题;
  2. 修复了删除工作空间授权不成功的问题;
  3. 修复了资源目录数据库资源显示问题;
  4. 修复了基础设施 > 主机页面点击排序按钮后页面上的主机数据会变少的问题;
  5. 修复了新注册账号时,费用中心用户名取值错误的问题;
  6. 修复了绑定外部索引(TLS/ES)时出现系统内部错误的问题;
  7. 修复了创建工作空间报错的问题;
  8. 修复了对 Redis 指标数据做下钻分析时页面报创建 Func 查询任务失败的错误;
  9. 修复了 Dashboard 中有时能查询到数据,有时报错 Internal Server Error 的问题;
  10. 修复了基础设施中的 K8s 中的 event 相关 container_crash 跳转后“未找到指定视图”的问题;
  11. 修复了集成 > prometheus exporter 指标采集时不同版本采集的界面展示相同的问题;
  12. 修复了日志流图单位设置中部分字段未展示的问题;
  13. 修复了 Open API 调用结果和文档不符的问题;
  14. 修复了系统视图 “APM P90 Resource Analysis View” 中没有包含图表的问题;
  15. 修复了告警策略未能成功向客户发送邮件的问题;
  16. 修复了事件模版中输出的 Json 的 key:value 格式不遵循查看器中查看的格式的问题;
  17. 修复了主机数据上报监控器产生误告警的问题;
  18. 修复了 SourceMap 上传时会出现 502 报错的问题;
  19. 修复了 Webhook 告警流程遗漏的问题;
  20. 修复了在绘制面板时,用 DQL 查询日志出现异常字段的问题;
  21. 修复了仪表板查询报错 unknown Scalar function 的问题;
  22. 修复了仪表板中的 DQL 切换为简单查询后会出现不匹配的情况的问题;
  23. 修复了 Studio dashboard > Pie Chart 在 Data Display 模块中无法正常工作的问题;
  24. 修复了杭州站点,指标管理界面 > 时间线页面报错 400 的问题;
  25. 修复了集成 > 云账号管理的文案有错误的问题;
  26. 修复了 RUM ERROR 聚类分析有误的问题;
  27. 修复了 RUM 无法查询 Session 和 View 数据的问题;
  28. 修复了 Warrom issues 的问题;
  29. 修复了指定资源存在 entry 和 exit 两种 span 类型,但过滤 entry 类型的 span 时在列表中无结果的问题;
  30. 修复了查看服务列表展示不完整的问题。

2025 年 9 月 3 日

功能更新

安全巡检

安全巡检功能正式下线。其相关功能可通过安全监测 > 安全事件管理(SIEM)模块实现。

LLM 监测

观测云推出 LLM 监测,提供面向大模型应用的“监测 + 追踪”能力,告别模型运行“黑箱”,为每次调用完整记录输入/输出、工具调用、重试、延迟、成本与 token,用可视化 Trace 与按会话聚合的 Session 便于回放与排障,实现全链路透明化管理。现已优先支持 Langfuse 集成,如果您已是 Langfuse 用户,可快速开启 LLM 监控能力。

免费计划

面向独立开发者与小团队,观测云新增免费专区(北京)节点,在该节点下,可注册免费版本(其他站点不再支持创建体验版工作空间),覆盖关键核心功能。

Open API

异常追踪 > 日程:支持添加获取日历和过滤日程等参数。

查看器

  1. 日志查看器:

    • 新增高级联动配置:支持为单个字段配置跳转链接,从而直接从当前字段打开目标页面,通过变量完成参数传递,联动分析。
    • 日志查看器显示项优化:

      • 新增“删除全部字段”、“重置字段”按钮;
      • 新增“时间列”显示开关。
  2. 全部查看器

    • 支持 DQL 查询模式。
    • 支持通过 CIDR 函数搜索单个 IP 字段下的所有 IP 地址的事件内容。

事件中心

  1. 由 SIEM 规则产生的事件(security)支持在详情页进行 Obsy AI 智能分析。
  2. 不限制 dimension tags,默认支持跳转至日志/链路查看器。

监控

  1. 告警策略管理:在规则聚合模式下,支持选择仅“发送首条告警”,从而避免等待聚合而错过重要异常事件。
  2. 监控器 > 事件内容支持定义域名变量:

    • df_studio_env_name:当前环境名称
    • df_studio_console_base_url:当前环境控制台地址
    • df_studio_monitor_base_link:当前环境监控器地址

管理

工作空间管理员支持在工作空间级别关闭 AI 智能分析

指标 > 指标分析

  1. 表格图模式下新增 Prom 模式,展示 PromQL 查询的返回结果。
  2. 独立图表模式下,基于查询条件新增图表标题。

基础设施

主机、容器查看器支持直接新建静默规则。

可用性监测

拨测任务:请求体内容新增支持 multipart/form-data

敏感数据扫描

支持覆盖全部数据类型,不再仅限制针对日志数据进行扫描。

移动端 RUM

分析看板新增“崩溃分析”、“卡顿分析” tab 页。

新增集成

  1. 新增 Squid 集成;
  2. 新增 Openrety 集成;
  3. 新增 Kafka 4.0 集成;
  4. 新增 AWS MWAA 集成;
  5. 新增 AWS Step Function State Machine 集成;
  6. 新增阿里云 GA 集成;
  7. 更新 Nginx tracing 集成;
  8. 更新 AWS OpenSearch 监控器/视图。

Bug 修复

  1. 修复了仪表板分组表格图别名存在不生效的问题;
  2. 修复了概览图展示结果不正确的问题;
  3. 修复了 Import Dashboard(multiple dashboards - zip file)出现中文的问题;
  4. 修复了漏斗图跳转到会话列表,但会话重放显示错误的问题;
  5. 修复了已设置静默但依然发送告警事件的问题;
  6. 修复了基础设施主机标签不显示的问题;
  7. 修复了安卓端查看器中有数据但对应时间段的分析看板图表不显示数据的问题;
  8. 修复了服务拓扑图中服务间没有连线的问题;
  9. 修复了告警静默配置不正确导致全部告警失效的问题;
  10. 修复了图表 DQL 语句查询不到结果的问题;
  11. 修复了广州站点拨测任务报错的问题;
  12. 修复了部署版管理后台导入模板结果不符合预期的问题。

2025 年 8 月 13 日

功能更新

Open API

支持为 Token 自定义角色。

RUM

为覆盖不同量级应用数据的查询场景,系统针对 RUM 数据写入做出优化。由此同步作出以下更新:

  1. RUM 数据查询下钻至应用层级:

  2. 查看器/分析看板:页面顶部新增应用筛选,默认选中“全部应用”,支持自定义单选或多选;选中应用后方可触发查询。

  3. DQL 查询语句支持单个或多个应用查询;更多使用说明可前往 RUM 数据

    R(app name1)::view:(count_distinct(username))   # 指定查询某个应用名称的 UV
    R(app id1)::view:(count_distinct(username))     # 指定查询某个应用 ID 的 UV
    R(*)::view:(count_distinct(username))   # 指定查询空间内所有应用的 UV
    
  4. 现有用户如遇应用数据查询性能瓶颈,可联系客户经理开通管理后台的“用户访问数据拆表”功能。新用户创建工作空间后,系统会根据不同的应用自动进行拆表数据写入。

场景

  1. 定时报告:新增归档报告:支持按设定周期(每日/每周)对仪表板进行全量数据的计算并生成静态快照,归档结果将长期保留,不受仪表板配置变更影响,可在平台内查看归档结果或按配置发送通知。

  2. 仪表板 > 日志分析:新增支持自动带入该仪表板的视图变量做为筛选条件展示。

  3. 日志流图:支持查询平台内所有数据来源。

查看器

搜索栏支持 querystring(md5(xxx)) 的分词查询方式。如果数据经过 MD5 加密,且需要在查看器中搜索定位扫描后的数据,可使用此种方式进行查询。

DataFlux Func

为增加 DataFlux Func 托管版安全保护,做出以下更新:

  1. 控制台托管版页面取消“重置密码”操作,并不再将初始账号密码发送至邮箱;
  2. 针对新创建的托管版,默认禁止使用 Func 页面登录,仅支持通过控制台用户授权免登。
  3. 已安装的托管 Func:升级至 7.2.0 及以上版本后,支持两种登录方式:

    • 已授权的 Studio 用户 可直接通过控制台 > DataFlux Func 托管版界面登录;
    • 也可使用之前在 Func 中创建的用户(包括初始化的 admin 用户)通过 Func 页面登录。

APM

  1. 链路 > 瀑布图详情页/代码热点 tab 页:资源支持一键展开或收起;

  2. 拓扑图:新增支持 “P95 响应时间”显示。

可用性监测

  1. 拨测任务 > 请求体:支持配置四类动态变量:

    {{ timestamp "ns" }} //1754379375400790109
    {{ date "rfc3339" }} // 2006-01-02T15:04:05Z07:00
    {{ date "iso8601" }} // 2006-01-02T15:04:05Z
    {{ urlencode "hello world" }} // hello+world
    
  2. 新增支持一键克隆拨测任务。

监控

  1. 阈值检测 > 检测指标:支持跨工作空间选择指标数据。后续监控器规则创建成功后,即可实现跨工作空间的告警配置。

  2. 监控器列表:快捷筛选监控器后,支持跨页全选并一键导出。

事件

针对恢复事件,新增定义 df_fault_end_time 扩展字段为故障恢复时间。

DCA

  1. 列表支持全选数据;

  2. 支持基于 DataKit 版本 (datakit_ver)、操作系统 (os)、环境 (env) 等配置筛选条件;

  3. 列表新增环境展示。

管理

  1. 角色权限:新增 “Client Token 查看”权限。

  2. 跨工作空间授权:编辑或删除授权规则时,若删减数据范围或日志索引,确认后新增弹窗,显示受影响的监控器和数据访问配置名称,同时支持导出该列表为 CSV 文件。

  3. 系统通知:新增订阅类型——“监控器”:一旦监控器失效,系统将发送邮件通知。

新增集成

  1. 新增 AWS SSM RunCommand 集成;
  2. 新增 AWS EBS 集成;
  3. 新增 AWS ECR 集成;
  4. 新增 AWS EFS 集成;
  5. 新增 TDengine 监控器;
  6. 新增 Milvus K8s 视图;
  7. 更新 Azure 云账单:EA 架构支持;
  8. 重写 OTEL jvm 仪表板:1.* 和 2.* 指标不同(java agent);
  9. 华为云账单脚本更新:修复因缺少实例 ID 导致的账单异常问题;
  10. SIEM 模版上线(10 个 AWS 模版);
  11. 优化 AWS MemoryDB;
  12. 优化 Tomcat 监控器;
  13. 优化腾讯云 MySQL,支持云盘版(云盘)节点维度指标、慢日志采集;
  14. 优化阿里云 Oceanbase 采集器,支持补充租户数据。

Bug 修复

  1. 修复了近期日志查询较慢的问题;
  2. 修复了资源对象的数据表现不一致的问题;
  3. 修复了链路关联日志显示为 0 的问题;
  4. 修复了部署成功后点击代码热点报错的问题;
  5. 修复了仪表板日志流图滑动到底部后数据显示异常的问题;
  6. 修复了仪表盘导入 JSON 时,设置了 identifier 导致导入报错的问题;
  7. 修复了资源目录官方模板库跳转位置不正确的问题;
  8. 修复了敏感数据扫描配置后不生效的问题;
  9. 修复了 count_distinct 查询结果比 count 查询结果还要多的问题;
  10. 修复了链路详情页不展示数据的问题;
  11. 修复了 PromQL 语句报错,换个查询时间区间就不报错的问题;
  12. 修复了链路的 service name 未正常显示的问题;
  13. 修复了 Picture 图表不可修改的问题;
  14. 修复了云账单在生产环境无法写入的问题;
  15. 修复了仪表板中的服务拓扑图表展示异常的问题;
  16. 修复了站点注册开通失败的问题;
  17. 修复了 RUM 漏斗功能显示异常的问题;
  18. 修复了导入仪表盘后有概率发生仪表盘列表缺失,需重新进入页面才能完整显示的问题;
  19. 修复了界面接入指引存在误导的问题;
  20. 修复了界面操作报 406 - kodo API 异常的问题;
  21. 修复了 SourceMap 文件路径、环境、版本均正确,但无法解析源代码的问题;
  22. 修复了日志索引数据展示出现异常的问题;
  23. 修复了页面上添加 APM 引导页面的问题;
  24. 修复了分享图表后标题显示变量的问题;
  25. 修复了链路火焰图点击不同服务时,服务上下文不跟随更新的问题;
  26. 修复了仪表板视图变量模糊查询搜索数据不正常的问题;
  27. 修复了 Pipeline 脚本保存失败的问题;
  28. 修复了 SEIM 添加模板后模板未生效,但标签生效的问题;
  29. 修复了部署版的 nsqd 日志中出现 topic 404 的问题;
  30. 修复了热门页面性能概览无法正常显示加载时间的问题;
  31. 修复了链路详情页面 .net profile 数据没有查看详情按钮的问题;
  32. 修复了同样 DQL 表达式查询偶发性不显示数据的问题;
  33. 修复了应用性能监控中基础设施依赖显示不稳定的问题;
  34. 修复了 DQL 子查询不生效的问题;
  35. 修复了事件中心对事件做静默操作后平台页面报错的问题。

2025 年 7 月 23 日

功能更新

监控

  1. SLO

    • SLO 扣分以“秒”级频率执行;
    • SLI 事件中新增展示对应监控器下产生的事件信息
    • 详情页新增总览页面,相关关键指标图表与右上角的时间控件联动动态统计。
    • 新增 “SLO 修正”配置,当 SLO 因不可控因素(如基础设施故障、第三方服务中断)即将违反时,通过临时修正机制避免误报警,同时保证 SLO 数据的审计合规性。
  2. 告警策略

事件中心

  1. 默认查看器页面的时间控件刷新时间默认设置为每 30 秒刷新一次;
  2. 详情页告警通知不再显示发送状态。

付费计划与账单

  1. 使用统计:新增“备份日志数增量”展示,用于统计每日新增备份日志的数量;
  2. 使用量分析:默认进入查询时间调整为“今日”。

基础组件

  1. 针对快捷入口 > 快照显示页:

    • 支持基于类型进行筛选;
    • 支持批量删除操作。
  2. 查看器

    • 搜索栏:
      • 最近查询展示数量调整为 10 条,保存数量调整为 50 条;
      • 支持置顶查询条件;
    • 快捷筛选 > 空间筛选项:配置字段后,系统会自动添加索引。同时,在查看器搜索栏和图表查询下拉组件中,会为这部分字段新增 icon 标识。
    • 详情页:扩展字段针对已添加到显示列的字段新增 icon 标识,以便区分。

基础设施

  1. 数据库:新增 SQL Server 数据采集类型,详情页可查看所有 Table 相关信息,包括列、索引、外键。
  2. 资源目录:自定义对象查看器详情页新增“完整信息” tab 页。

指标

指标管理:新增标签的“唯一值数量”展示,统计标签值在全局或单个指标维度下的去重计数。

Pipelines

一键获取样本:支持指定数据来源来获取测试数据。

场景 > 排行榜

外部数据源查询支持排序。

管理

  1. 数据转发:支持多个筛选条件为 OR;
  2. Token:更换 Token 时,新增配置调整权限范围,支持仅做为上报使用。
  3. 敏感数据扫描:自定义规则内支持环视正则测试匹配
  4. 支持中心 > 工单:新增工单描述字数上限。

新增集成

  1. 新增华为云 APIG 集成;
  2. 新增华为云 SFS Turbo 集成;
  3. 优化阿里云 ECS 集成视图;
  4. 更新 AWS SQS 集成;
  5. 腾讯云云产品采集优化,支持多维度指标采集(云监控 V2);

    • EIP
    • COS
    • MySQL
    • PostgreSQL
    • MariaDB
    • TDSQL-C MySQL
    • TDSQL-C PostgreSQL
    • Redis
    • KeeWiDB
    • MongoDB
    • Memcached
  6. 华为云集成相关文档内容格式调整。

Bug 修复

  1. 修复了 Issue 自动发现创建的 Issue,手动更改状态后无法新建 Issue 的问题;
  2. 修复了日志查看器状态分布图展示异常的问题;
  3. 修复了会话重放显示过期的问题;
  4. 修复了事件中心显示项更改为列表模式后无数据的问题;
  5. 修复了事件数据前端显示异常的问题;
  6. 修复了用户访问监测查看器 Resource 数据显示异常的问题;
  7. 修复了转发数据在查询时报错问题;
  8. 修复了部署版 /api/v1/inner/alert_opt/get、/api/v1/account/list 接口异常的问题;
  9. 修复了链路关联 Pod 监控视图模板未更新的问题;
  10. 修复了数据访问输入数据范围筛选展示异常的问题;
  11. 修复了在时序图 > 柱状图中 PromQL 按照 1d 去切片返回的时间范围有问题的问题;
  12. 修复了 PromQL 查询的语句小时区间内数据存在,天级别区间内数据不存在的问题;
  13. 修复了 webpack 插件显示 SourceMap 文件上传成功,但无法在 SourceMap 列表查看的问题;
  14. 修复了异常追踪 > Issue 自动发现产生了重复的 Issue 的问题;
  15. 修复了 Prometheus 函数 idelta 不符合预期的问题;
  16. 修复了相同查询条件下日志查看器查询结果和 DQL 查询结果差距较大的问题;
  17. 修复了监控器设置了 df_label 但是产生的事件中 df_label 没有值,导致用户静默策略没有生效的问题;
  18. 修复了 Pipeline 中用户访问中 IP 字段未生效的问题;
  19. 修复了私有化环境 kodo-x 升级后报错的问题;
  20. 修复了链路详情显示“顶层 Span 缺失”,但顶层 Span 实际存在的问题;
  21. 修复了用户访问监测 > 应用列表无法查询应用数据的问题;
  22. 修复了工作空间的付费计划与账单看不到消费明细的问题;
  23. 修复了保存快照中,客户在输入快照名称时按下回车会直接保存的问题;
  24. 修复了日志月账单用量为 0 但被扣费的问题;
  25. 修复了 src_ipdst_ip 的展示判断的问题;
  26. 修复了相同时间区间,日志查看器柱状图偶发性显示错误的问题;
  27. 修复了异常追踪 > 搜索功能的使用问题;
  28. 修复了可用性监测的任务勾选了 follow direction,但该配置未生效且再次编辑时会被清空的问题;
  29. 修复了日志索引查询多天时,条数和 TLS 不一致的问题。

2025 年 7 月 9 日

功能更新

付费计划与账单

  1. 推出全新的计费模型:企业版。该模型采用数据流量 + 存储总量组合计费,更准确地贴合极高日志写入量场景下的实际资源消耗,让用户的成本结构更透明、更可预测。这种模式为处理海量观测数据提供了优化的成本效益,是打造“全域可控的企业级观测中枢”的基础能力之一。

    • 企业版工作空间内,数据存储策略支持自定义配置;
    • 如需由体验版升级为企业版,需联系您的客户经理。
  2. 商业版:

    • 使用统计、使用量分析计费项名称调整;
    • 商业版时间线 180 天、360 天价格调整。

监控

  1. 监控器 > 阈值检测:检测指标支持查询外部数据源;
  2. 监控器列表:支持基于监控器 ID 进行搜索定位。

事件中心

  1. 新增显示项:支持切换标准和列表模式展示。
  2. 变更事件 > 详情页:基础属性作出以下调整:

    • 变更内容:展示 df_message 内容,记录资源变更的详细描述;
    • 差异对比:展示 diff 的内容,记录资源更改的差异文本。

场景 > 图表

  1. SLO 图表:锁定时间新增“本年”动态时间选项;
  2. 热力图:

    • 新增“指标”数据源类型查询;
    • 新增 Y 轴配置,支持基于数据计算 Y 轴。

基础设施

  1. 网络 > 总览

    • 支持自定义分析纬度:通过选择源和目标的查询字段,展示聚合查询数据;
    • 支持跨工作空间查询网络数据。
  2. 数据库:

    • 新增集成 Oracle 数据库;
    • 针对 PostgreSQL 数据库,可查看所有 Table 相关信息,包括列、索引、外键。

指标

  1. 生成指标:支持不同的生成规则指定相同的指标名及 tag;
  2. 指标管理:新增指标集级别的时间线多维度分析。

部署版更新

工作空间列表 > 索引配置:支持配置数据存储策略。

新增集成

  1. 新增 OpenLLMetry 集成;
  2. 新增 Undertow 集成;
  3. 新增 Cloudflare 集成;
  4. 新增 华为云 CDM 集成;
  5. 新增 华为云 DWS 集成;
  6. 新增 华为云 NAT 集成;
  7. 新增 AWS Transit Gateway 集成;
  8. 更新火山 ECS 监控器、视图;
  9. 更新 MinIO 视图、监控器;
  10. 优化集成 华为云 ASM / CCE;
  11. 优化集成 阿里云 SAE;
  12. 优化集成 JMX / MQTT。

Bug 修复

  1. 修复了通过免登录 Token 访问 SaaS 环境时,查看会话重放数据报错 404 的问题。
  2. 修复了用户访问检测中,Issue 自动发现配置内容未被识别的问题。
  3. 修复了监控拨测告警产生的事件中,事件详情未显示具体关联信息的问题。
  4. 修复了在全局标签中添加标签后,修改标签名称提示已存在重名标签的问题。
  5. 修复了 DQL 查询返回结果异常的问题。
  6. 修复了通过 PromQL 查询指标失效,但使用 DQL 查询正常的问题。
  7. 修复了在多集群场景下,查看 Deployment > Pod 信息出现错乱的问题。
  8. 修复了日志状态分布图显示异常的问题。
  9. 修复了 RUM 筛选器时间范围与时间选择器不一致,导致无法查看应用数据的问题。
  10. 修复了用户访问监测 Error 查看器中,Issue 自动发现模板变量不生效的问题。
  11. 修复了添加 Webhook 通知对象时报错“无效的地址”的问题。
  12. 修复了底座转发数据出现堆积的问题。
  13. 修复了日志状态分布图显示异常的问题。
  14. 修复了 DQL 查询数据为 0 导致误告警频繁的问题。
  15. 修复了底座查询工具查询日志时,不能排序、slimit 无效且无法分页的问题。
  16. 修复了时序查询中,出现不受过滤条件约束且没有任何 tag 的时间线的问题。

2025 年 6 月 25 日

Breaking Changes

提取事件 df_meta 字段中的 df_check_targetsdf_check_conditiondf_check_rules 为同一层级。后续在 webhook 通知中,当 df_source = monitor,会展示监控器配置中检测时间、检测指标、检测次数、检测规则等信息。

功能更新

External API

  1. 新增接口 index_list_info 以查询工作空间索引信息列表;
  2. 新增接口 update_index_setting 以修改工作空间索引配置。

外部数据源

新增集成 PG、Oracle、Clickhouse 三种外部数据源类型,以满足更广泛的数据场景需求。

日志

新增原生直写索引类型,可在数据采集时直接指定写入索引,实现精准分类与存储。

监控

  1. 区间检测 V2 支持检测 APM、RUM 数据类型;
  2. 突变检测 > 事件内容:新增 df_check_detail 扩展字段,支持将突变对比原始值输出到事件详情。

事件

  1. 基于监控器配置规则而触发的告警事件支持 Obsy AI 智能分析

基础设施 > 数据库

  1. 新增集成 PostgreSQL 数据库;
  2. 针对 MySQL 数据库,可查看所有 Table 相关信息,包括列、索引、外键。

查看器

搜索栏新增查询历史记录展示,点击可直接复用并灵活修改。

云账号管理

新增支持腾讯云Azure 账号类型。

场景

  1. 调整导入仪表板入口,整合原自定义模板导入功能,同时支持批量导入仪表板。
  2. 仪表板页面新增“日志分析”功能,无需跳转页面,直接在侧滑新页中一键式查看和分析相关日志数据。

异常追踪

控制台左侧“异常追踪”菜单栏新增“异常追踪管理”入口,可直接跳转至管理页。

新增集成

  1. 新增火山 NAT 集成;
  2. 新增 Ceph 集成;
  3. 更新 Clickhouse 集成;
  4. 华为云云账单脚本优化;
  5. 新增腾讯云账单;
  6. 新增腾讯云 WAF 集成;
  7. 新增腾讯云 ES 集成;
  8. 新增腾讯云 cos/cdb/mariadb/postgresql 英文版视图、监控器;
  9. 新增 AWS Firehose;
  10. 新增 AWS VPC NAT Gateway 集成文档;
  11. AWS 云账单脚本更新:T+1 计算方式导致部分组件计费存在误差(比如 EC2),调整为 T-2;
  12. 新增 Azure 云账单。

Bug 修复

  1. 修复了生成指标后数据显示异常的问题;
  2. 修复了日志详情页点击“加载更多”后日志内容无法加载的问题;
  3. 修复了 RUM 开通链接失效且无报价内容的问题;
  4. 修复了在 Issue 中点击关联事件跳转后无法查询到数据的问题;
  5. 修复了新建基础设施存活检测 v2 类型的监控器会报错 406 的问题;
  6. 修复了会话重放页面加载慢的问题;
  7. 修复了 Open API 创建静默规则没有自动生成规则名称的问题;
  8. 修复了输入 PromQL 查询指标时报错的问题;
  9. 修复了页面错误率显示异常的问题;
  10. 修复了主机标签频繁性消失的问题;
  11. 修复了资源调用排行榜加搜索条件后降序排列无效果的问题;
  12. 修复了勾选 7 天免 MFA 登录后,若解绑 MFA 并登出重新登录,系统未提示重新绑定的问题;
  13. 修复了仪表盘数据导出的 CSV 文件中,因别名为空导致无法正确渲染的问题;
  14. 修复了监控器未能正常产生告警,自观测日志有报错查询超时的问题;
  15. 修复了后台管理导入字段后会被自动删除的问题;
  16. 修复了用户体验数据丢失的问题。

2025 年 6 月 11 日

功能更新

付费计划与账单

新增统计项:链路写入流量、用户访问写入流量、SIEM 扫描量使用量分析同步展示新增统计项数据。

场景

仪表板 > AI 智能分析:新增支持自动错误发现和错误分析,进一步增强 Obsy AI 数据处理能力。

监控器

  1. 检测频率支持最短自定义输入 20s,系统新增支持选中 30s;
  2. 应用性能指标检测、用户访问指标检测分别支持多选服务应用

SIEM

官方检测库上线:系统提供开箱即用的安全信息检测模版库。

基础设施 > 数据库

  1. 支持跨工作空间数据查看;
  2. 新增字段:QPSTPS平均查询耗时慢查询日志状态慢查询数

指标 > 指标分析

  1. 新增独立图表模式,适用同时添加多条查询,且查询结果单位不一致的场景;
  2. 新增支持显示分组统计总数,同时默认 slimit 改为 50 条。

日志 > 查看器

  1. 堆叠模式下新增换行开关;
  2. 上下文日志支持点击时间列进行升降排序。

云账号管理

云账号类型新增支持华为云。

管理 > 环境变量

RUM Android/iOS SDK 支持通过环境变量动态更新。

查询工具

  1. 表格图及指标分析的简单查询均支持选择多列;
  2. DQL 快捷查询默认为简单模式,支持多列配置查询。

APM

ddtrace 新增 package 级别的埋点配置,如需对 package 为 com.zyjavax.servlet包下所有的方法进行埋点,则可按照以下方式进行配置 -Ddd.trace.method.packages=com.zy,javax.servlet

部署版更新

  1. 映射规则新增“追加映射”开关。开启后,使用单点登录的账号会依映射规则分配工作空间和角色,原有工作空间与角色保持不变。
  2. 针对使用 ScopeDB 引擎的工作空间,支持配置租户级别的查询。

新增集成

  1. 优化腾讯云账单脚本,支持子客的方式获取账单信息;
  2. 新增腾讯云账单集成;
  3. 新增腾讯云 EIP 集成文档;
  4. 新增腾讯云 CDB 监控器(英文);
  5. 新增华为云云账单集成;
  6. AWS ELB 集成内容更新;
  7. AWS LAMBDA 集成内容更新;
  8. AWS S3 集成内容更新;
  9. 新增 AWS Aurora MySQL 集成;
  10. 新增 AWS Aurora PostgreSQL 集成;
  11. 新增 Hikaricp 集成;
  12. TiDB Cloud 视图优化;
  13. 新增 vpc 集成;
  14. 新增 AWS rds postgresql 集成。

Bug 修复

  1. 修复了新加坡站点用户空间 resource 查看器中不显示 userid 的问题;
  2. 修复了无法通过 action 查看器查询到自定义上报的 userid 的问题;
  3. 修复了仪表板 AI 分析结果不准确的问题;
  4. 修复了 Open API 获取时序趋势图的问题;
  5. 修复了监控器修改页面数据断档内容显示有延时的问题;
  6. 修复了使用 webpack plugin 上传 SourceMap 时跳过已有文件的问题;
  7. 修复了网络功能下的快捷筛选出现错误的问题;
  8. 修复了通过变量的过滤器不能正常运行的问题;
  9. 修复了渗透测试高危漏洞的问题;
  10. 修复了新加坡站点用户访问分析看板 > 资源分析部分仪表盘报错的问题;
  11. 修复了面板链接跳转值变量 undefined 的问题;
  12. 修复了日志查看器右上角无时间选择框的问题;
  13. 修复了监控器(APM)预览图表显示数据与实际不符的问题;
  14. 修复了跨空间授权时邮件内部关于钉钉和微信的显示问题;
  15. 修复了管理后台 SSO 用户的用户列表与用户详情不一致的问题;
  16. 修复了外部数据库的数据源查询的展示问题;
  17. 修复了新建阈值监控器趋势图的显示问题;
  18. 修复了 APM 查看服务时候搜索失败的问题;
  19. 修复了 DQL 查询报错的问题;
  20. 修复了每天重复的静默规则未按预期每日发送静默生效通知的问题;
  21. 修复了从 RUM 会话重放进入链路后无法查看 AI 分析按钮的问题。

2025 年 5 月 28 日

Open API 更新

异常追踪在列出和获取时支持返回关联事件数量信息。

功能更新

SIEM

  1. 检测规则:新增测试、全屏编辑脚本功能;
  2. 新增信号查看器;
  3. 新增执行日志查看器。

监控

  1. 告警策略 > 关联:新增选择 SIEM 检测规则,同步支持直接创建。
  2. 编辑监控器规则 > 检测指标新增支持 PromQL 查询预览。
  3. 监控器规则列表:

    • 导入时新增支持在操作页“删除并导入同名监控器”;
    • 支持根据一键导出当前工作空间所有的监控器规则配置。
    • 智能巡检功能入口下线。

基础设施

  1. 容器:新增 Persistent Volume Claims 查看器
  2. 新增数据库查看器,通过提供一个集中化的查看器工具,实时监控 MySQL 数据库的性能指标、资源使用情况和日志记录。
  3. 资源目录:资源分类新增数据库,并展示所有数据库总数。

异常追踪

  1. 频道 > Issue 详情页:新增“关联事件”,可直接点击跳转至事件列表进行查看;Issue 邮件等发送的通知事件中同步新增关联事件展示;
  2. 通知策略 > Issue 升级:新增事件风暴选项。可设定 Issue 关联事件数累计超过特定条数后,系统发送“重复”或“一次”通知提醒。

事件

未恢复事件:

  • 新增“静默”按钮。点击后,可直接在当前页面对规则进行“静默”配置。
  • 新增“一键恢复全部”按钮。点击后,即可恢复当前列表下的所有异常事件,可选择是否关联 Issues。

APM

火焰图:新增“定位到当前 Span” 功能按钮。

RUM

  1. WEB SDK 新增客户端所在时区记录。
  2. Session Replay 查看页面新增客户端所在时区展示。
  3. 所有时间控件统一添加时区显示。

场景

  1. 仪表板 > Obsy AI 智能分析:

    • 优化页面显示效果;
    • 优化问题输出。
  2. 图表

    • 时序图:新增提示:查询已超出时序图最大数量上限,仅展示 1,000 条数据点;
    • 柱状图鼠标悬浮颜色调整;
    • 表格图顺序调整优化:兼容 PromQL 查询。

指标

指标分析:新增查询历史和单位配置。

管理

  1. 敏感数据脱敏:支持一个规则针对多个字段配置脱敏。
  2. 数据访问:编辑页面新增访问站点选择。

查看器 > 快捷筛选

  1. 所有查看器:

    • 编辑模式下,支持对“筛选字段”、“可选字段”进行修改;
    • 新增隐藏字段别名功能;
    • 搜索字段时,若查询结果无精准匹配的值,可直接创建添加到“筛选字段”中。
  2. 日志查看器:

注册

登录注册页面显示优化。

部署版更新

配置管理 > Issue 发现:规则检频率新增支持 1 分钟。

新增集成

  1. 新增 TiDB Cloud 集成文档文档;
  2. 新增 Traefik 集成文档;
  3. 新增 AWS cognito 集成;
  4. 新增 AWS certificatemanager 集成;
  5. 新增 AWS RDS PostgreSQL 集成文档;
  6. 新增 aliyun rabbitmq 集成;
  7. 更新 haproxy 视图和监控器;
  8. 新增华为云 DIS 英文监控器、视图;
  9. 更新 AWS ELB application 集成文档、视图, 新增 AWS ELB application监控器;
  10. 更新 AWS lambda 集成文档,新增 Lambda 抓取 S3 日志数据操作步骤。

Bug 修复

  1. 修复了生成指标数据没有正常上报的问题。
  2. 修复了调用 Open API 导入监控器接口时,存在标签导入失败的问题。
  3. 修复拨测任务未停止的问题。
  4. 修复了日志详情中点击查看“上下文日志”报错 406 的问题。
  5. 修复了监控器仅配置通知对象而未配置成员时,代码中 alertPolicyMemberInfos 显示有成员存在的缓存问题。
  6. 修复了监控器中数据断档选择将结果视为 0 后保存未生效的问题。
  7. 修复了批量恢复告警时失败并报错的问题。
  8. 修复了日志查看器查询结果数量不一致的问题。
  9. 修复了通过 API 批量修改监控器时,未配置 extendrule 字段,导致原有数据被覆盖的问题。
  10. 修复了后台管理导入内置视图模板后未被正确替换的问题。
  11. 修复了日志索引配置一键获取关键字段后,未联动日志查看器堆叠模式展示关键字段,而是根据显示项展示的问题。
  12. 修复了监控器执行日志出现 critical 级别报错的问题。
  13. 修复了 DQL 子查询不生效的问题。
  14. 修复了点击排行榜视图并选择应用到视图变量时,变量值中逗号未转义导致填充错误条件的问题。

2025 年 5 月 14 日

观测云以创新视觉形象,彰显在 AI 浪潮中的迭代信念与技术力量。

从此刻开始,Obsy 将陪您一起洞察数据世界、驾驭系统复杂性,走在 AI 时代的最前沿。

External API

仪表板:支持通过标识 ID 全局导入平台级仪表板。此操作仅更新仪表板配置,不会影响各工作空间内该视图的绑定关系。

功能更新

安全监测

新增 SIEM 功能模块:实时分析企业各类系统(如服务器、应用、网络设备)的日志和事件数据,自动发现潜在威胁,帮助团队迅速定位异常,充分发挥安全监控中枢的作用。

监控

  1. 告警策略:

    • 关联:支持选择 SIEM 检测规则;
    • 通知配置:新增“安全监测”类型的等级。
  2. 监控器:由于调整了“基础设施变更检测监控器”的数据写入,旧监控器需要重新保存,避免影响生成的事件显示。

事件中心

  1. “事件”功能模块更名为“事件中心”,交互页面优化。
  2. 新增事件中心查看器,支持集中查看所有事件数据。
  3. 事件恢复新增二次确认操作,避免误触的场景。

异常追踪

在异常追踪 > 日程中添加排班后,新建 Issue 或关联负责人时,可选择“值班人员”或“通知对象”。系统会根据当日值班人员自动分配 Issue 负责人并通知。

场景

  1. 仪表板:新增 Obsy AI 智能分析功能。
  2. 时间控件逻辑优化:当选择“相对时间”时,即使用户将刷新频率设置为“off”,只要修改查询条件(如查看器中使用快捷筛选增减条件、在搜索框中调整过滤条件,或在仪表板/笔记中切换视图变量),系统仍会重新触发查询。

管理

  1. 数据转发:针对 AWS S3、华为云 OBS、阿里云 OSS 这三种存档类型,新增加密存储选择开关。开启后,系统会对向外转发的数据作加密处理。
  2. 审计事件:新增工作空间字段标记。

基础设施

  1. 主机、容器、Pod 等详情页内置页面:

    • 时间控件:新增钉住功能;
    • 集成运行情况:“查看监控视图”页面优化;
    • 关联视图新增当前事件发生的时间轴线显示。
  2. 主机查看器:默认查询时间调整为“最近 2 小时”。

日志

优化日志多索引匹配命中逻辑,避免逐条匹配索引规则导致的计算浪费。

部署版更新

  1. 支持通过 External API 新建、删除和修改分组,以及在分组中添加或移除用户;
  2. 工作空间管理 > 数据存储策略:新增网络存储策略配置,支持选择固定 2 天的存储时长或自定义保存时长。
  3. 新增 Profile 数据上报动态参数开关。用户可根据平台性能情况动态开启或关闭 Profile 数据的上报。
  4. 新增 API Key 配置及 AI 功能访问链接配置开关,包括以下场景:

    • 监控器 > 告警策略中 > AI 告警聚合
    • AI 编写 Pipeline 入口
    • 场景 > 图表组件 > AI 图表标题及描述生成
    • 日志查看器 > 状态为 error 的日志详情、日志 > 错误追踪中 > AI 错误分析入口
    • RUM > Error 查看器 > AI 错误分析入口
    • 应用性能监测 > 链路查看器 > 状态为 error 的链路详情、应用性能监测 > 错误追踪 > 链路详情 > AI 错误分析入口
  5. 编辑告警策略时,支持自定义重复告警时间。自定义输入的沉默时间格式示例:20m(20 分钟)、2h(2 小时)、1d(1 天)。

新增集成

  1. 新增主机类监控器;
  2. 新增 MySQL 监控器;
  3. 更新 CouchDB 视图和监控器;
  4. 新增 ActiveMQ 集成;
  5. 新增 AWS SNS 集成;
  6. 新增火山 ESCloud 集成;
  7. 新增英文版华为云 API、华为云 CCE 监控器和仪表板;
  8. 新增火山云 RabbitMQ 集成;
  9. 修改 AWS MSK 集成指标。

Bug 修复

  1. 修复了通过 Vite 打包上传 SourceMap 时出现的 413 错误,以及 SourceMap 下载报错和观测云无法显示源码报错位置的问题。
  2. 修复了跨空间查询时,多个空间 RUM 数据无法正常显示的问题。
  3. 修复了日志查看器在选择自建的日志索引后,命名空间和服务显示数据不准确的问题。
  4. 修复了创建多步拨测时页面样式错乱的问题。
  5. 修复了日志查看器在多索引情况下,快捷筛选栏目无法正常显示命名空间的标签数据的问题。
  6. 修复了广州站点产生误告警误报的问题。
  7. 修复了 0409 版本使用托管 Doris 查看主机详情信息时出现异常的问题。
  8. 修复了查看外部数据源查询数据异常的问题。
  9. 修复了日志在聚类模式下展开单条日志时出现重影显示的问题。
  10. 修复了事件统计页仍展示已恢复事件的问题。
  11. 修复了未恢复事件在列表显示模式下点击“批量”按钮触发错误的问题。
  12. 修复了“数据转发”功能查询 S3 上的历史日志一直无法查询的问题。
  13. 修复了 1.109.196 版本火山底座 FUNC 告警消息发送的日志上报到业务空间的问题。

2025 年 4 月 23 日

Breaking Change

拨测数据存储调整:将拨测数据从原日志索引中拆离,独立建表存储,并新增专属查询 Namespace D。此调整不影响历史拨测数据。若之前通过自定义图表查询拨测数据,请及时更新查询配置。官方拨测模板(如 HTTPICMPTCPWebSocket多步拨测)及相关监控器、指标规则均已适配此次变更。

External API

  1. 支持新增、修改列出指定工作空间的角色列表、成员列表接口;
  2. 优化 OpenAP、External API 重的接口名和描述信息。

功能更新

RUM

  1. SDK 支持通过环境变量热更新:通过预先定义变量参数,在应用内部通过环境变量的引入变量实现配置的动态更新。
  2. 应用 > 新建应用:用户通过自定义参数配置,左侧代码示例将实时更新,系统会缓存最新参数配置,无需每次重新填写。
  3. Error 查看器:新增支持 Obsy AI 错误分析。对单条 RUM 错误日志进行智能解析,自动提取关键信息,并通过集成在线搜索获取初步的解决思路和建议。

基础设施

  1. 跨工作空间授权:若存在被授权的工作空间,且被授权的数据类型为“基础对象”,在基础设施各对象类型查看器页面可直接切换工作空间,实现对象数据跨空间查看。
  2. 新增“变更事件” tab 页,支持基于 Deployments、Daemonsets、Services、Cron Jobs、Statefulsets 五种对象类型数据展示变更详情,便于用户回溯变更记录。

监控

  1. 监控器 > 检测规则:新增“基础设施变更检测”。通过持续监控 Kubernetes 资源配置变更(如 YAML 文件修改),结合版本追踪与智能分析,实现合规性检查、故障根因定位及资源使用优化等效果,最终保障集群安全性、稳定性与资源效率。
  2. 检测规则 > 事件内容 > 自定义事件通知模版:新增时间自动转换模板函数 {{ df_fault_duration | to_date_range_human }}

事件

  1. 新增变更事件

    • 查看所有基于基础设施变更检测规则而触发产生的事件数据记录。
    • 所有事件详情 > 历史趋势:当检测对象存在变更事件时,时序图中会展示变更事件的时间节点,并支持点击后跳转至变更详情页。
  2. 事件查看器:

管理

数据转发 > 数据查看:搜索组件优化

图表导出

图表支持导出到同步创建的新仪表板或新笔记,应用范围包括:

  1. 指标分析
  2. 查看器 > 列表/维度分析

查看器

  1. 针对基本的“列表”查看和“维度分析”图表模式做交互调整;
  2. 维度分析:新增分组表格图。

集成

在控制台左侧菜单中,“云账号管理”功能访问路径由原先的管理界面调整至集成目录下。

部署版更新

支持调整登录方式(本地账号、LDAP 账号、OIDC)排序。

新增集成

  1. 新增 apollo
  2. 更新 Argocd 集成文档,调整为 kubernetesprometheus 采集指标信息;
  3. 更新 ingress nginx 文档视图监控器;
  4. Neo4j 更新仪表板&新增监控器;
  5. 新增 kubelet 集成;
  6. 新增 Azure Virtual Network Gateway 集成;
  7. 更新 TIDB 集成文档、视图和监控器;
  8. 阿里云 30 个组件新增 Automata 管理。

Bug 修复

  1. 修复了成员管理页面成员数量显示错误的问题。
  2. 修复了切换到英文界面后日志视图时间字段未翻译的问题。
  3. 修复了切换集群后 label 同步显示异常的问题。
  4. 修复了未接入移动端 SDK 时,在用户访问监测 > 分析看板 > 移动端 > 错误分析页面出现卡顿次数,从而影响用户数显示异常的问题。
  5. 修复了日志查看器 > 详情页出现时机判断的问题。

2025 年 4 月 9 日

Open API 更新

  1. 支持创建、编辑、删除多步拨测任务;
  2. 支持配置工作空间数量上限限制。

功能更新

场景

  1. 图表优化
    • 柱状图:
      • 调整别名位置,支持列出所有指标和分组;
      • 新增 X 轴配置项。
    • 分组表格图
      • 支持基于分组选择排序;
      • 返回数量下拉中新增 200 选项,支持手动输入最大数量调整为 1,000。
    • 时序图 > 折线图:新增线条“风格”设置,包括线性、平滑、前阶梯、后阶梯。
  2. 快照:针对配置权限的仪表板快照分享新增权限提示。
  3. 查看器、仪表板 > 时间控件:新增“最近 1 分钟”、“最近 5 分钟”,默认选中后者。

管理

  1. 跨工作空间授权:支持跨站点进行数据授权,实现扩展数据共享。
  2. 数据转发:
    • 数据类型新增“审计事件”。
    • 调整查看器的查询时间逻辑:
      • 更改为按天查询,不支持跨天查询;
      • 查看转发数据时,系统自动查询并持续加载直至完整显示,无需用户手动点击;
      • 管理 > 空间设置 > 高级设置:新增“数据转发查询时长”配置。
  3. 数据访问、Pipeline、黑名单权限拆分,将“管理”权限调整为:“新建、编辑”和“删除”。

监控

  1. 系统通知:新增关联日志的跳转链接,允许跳转到日志查看器并筛选出此通知对象发送失败的日志。
  2. 监控器:
    • 从模版新建 > 官方模版库:新增搜索功能;
    • 配置页面 > 事件内容:更新注意提示。仅当启用关联异常追踪时,@ 成员配置才会生效并向指定成员发送此处的事件内容。
    • 阈值检测:新增恢复条件开关,配置恢复条件及严重程度,当查询结果为多个值时,任意一值满足触发条件则产生恢复事件。

异常追踪

Issue 邮件通知中的“来源”修改为超链接,用户点击后可以直接访问。

RUM

SourceMap:

  • 页面交互调整,由原来的弹窗改为单独页面;
  • 列表页面新增搜索、导出功能。

Obsy AI 智能体

优化生成图表功能:通过本地 Func 缓存指标管理数据,生成的 DQL 更加贴近语义描述。

Obsy AI 错误分析

添加上下文支持根因分析,帮助用户更快、更全面理解错误发生的上下文,提高诊断效率。

集成 > 扩展

DataFlux Func 托管版/ RUM Headless:应用扣费新增邮件提醒和系统通知。

基础设施

主机 > 详情页:磁盘容量统计区分本地磁盘和远端磁盘显示。

部署版更新

模版管理:

  • 页面交互优化,包含显示列新增“模版类型”等;
  • 顶部筛选项新增“模版类型”;
  • 支持批量导出模版;
  • 导入模版时,支持预览查看模版详情;
  • 内置视图、Pipeline、监控器模板上传支持同名覆盖逻辑。

新增集成

  1. 新增 GCP Compute Engine
  2. 新增 Azure Storage
  3. 新增 Azure redis cache
  4. 新增 Azure kubernetes
  5. 新增 Azure Postgresql
  6. 新增 阿里云 Rds MYSQL Automata 集成;
  7. 新增 Druid 集成
  8. 更新 Trino
  9. 调整 AWS/阿里云关于 Automata 的集成文档:新增托管版开通脚本步骤。

Bug 修复

  1. 修复了调用 Open API 获取未恢复事件与实际不符的问题。
  2. 修复了事件查看器在搜索时报错的问题。
  3. 修复了外接数据源数据查询异常的问题。
  4. 修复了异常追踪邮件通知的相关问题。
  5. 修复了异常追踪 > 分析看板加载缓慢的问题。
  6. 修复了柱状图显示颜色不正确的问题。
  7. 修复了外部事件提示没有 AK 的问题。
  8. 修复了状态分布图、日志量没有正确显示的问题。

2025 年 3 月 26 日

功能更新

事件

  1. 未恢复事件:时间控件默认自动刷新,手动恢复事件恢复成功后新增前端页面提示。
  2. 事件详情:告警通知页面显示优化。
  3. 事件、智能监控查看器导出追加“是否通知”显示。

管理

数据转发:新增权限配置。通过为转发的数据设置查看权限,有效提高数据安全性。

监控

  1. 基础设施存活检测 V2:新增可配置检测区间。
  2. 告警策略:通知匹配逻辑调整,提升事件在命中多组策略及复杂告警策略场景下的执行效率。
  3. 通知对象管理:新增 SlackTeams 两个通知对象,以满足全球更多用户的需求。

场景

  1. 视图变量:支持外部数据源查询。
  2. 图表:

    • 新增“监控器总览”图表,集成监控器列表,展示最新状态,实现即时监测与异常态势感知。
    • 命令面板:显示优化;
    • 图表查询:在 DQL 查询中,使用 “wildcard” 或“正则”时,新增查询建议提示。
    • 查看器、仪表板 > 时间控件:新增“最近 1 分钟”和“最近 5 分钟”选项。

付费计划与账单

  1. 新增月账单模块,直观展示月消费总量。
  2. 新增导出账单功能。

用户访问监测

应用列表 > 新建应用:新增“压缩上传”和“自定义托管地址”的参数配置。

可用性监测

新增“南非”和“中国香港”作为拨测节点,进一步扩展全球覆盖范围。

日志

  1. 日志查看器
    • 快捷筛选操作项调整;
    • 列表分词逻辑优化;
    • JSON 格式数据新增 “JSON 搜索”;
  2. 索引 > 关键字段:新增“一键获取”。

新增集成

  1. 新增 Azure Network Interfaces
  2. 新增 Azure Kubernetes
  3. 新增 Azure virtual network gateway
  4. 完善英文集成翻译。

Bug 修复

  1. 修复了日志页面展示利用率不高的问题。
  2. 修复了 Service Map 的指标单位显示问题。
  3. 修复了表格图多列无法选择单位的问题。
  4. 修复了仪表板 > 日志流图导出 CSV 时,选择 1,000 以外的导出条数会报错的问题。
  5. 修复了最受欢迎页面的 P75 和 DQL 查询结果不一致的问题。
  6. 修复了时间筛选器点击 << 按钮后时间框仍然显示今日的问题。
  7. 修复了菜单管理不符合预期的问题。
  8. 修复了管理后台中搜索空间 ID 筛选异常的问题。
  9. 修复了 Pipeline 界面测试样本丢失的问题。
  10. 修复了配置迁移导出功能耗时过长的问题。
  11. 修复了升级后事件详情界面快捷筛选标签有大量空项的问题。
  12. 修复了监控器官方模板库检测库列表重复,且一旦选中检测库就无法搜索其他监控器的问题。

2025 年 3 月 12 日

Breaking Changes

事件 df_alert_info 字段定义调整,新增告警策略未匹配原因说明,仍然需要通过 isIgnored 做过滤判断获取实际对外发送的通知对象。

功能更新

异常追踪

  1. 新增异常追踪管理入口,通过该入口,当前登录用户可以查看和管理所有已加入工作空间的异常追踪状态。
  2. 优化异常追踪页面频道列表显示,提升频道过多时的查询效率。

管理

  1. 云账号管理:新增阿里云云账号授权类型。
  2. API Key 管理:新增对 API Key 的权限控制功能,支持添加角色授权。通过角色授权,API Key 仅具备角色范围内的操作权限,从而有效降低安全风险。
  3. 数据转发:默认交互变更为不选中规则。

Obsy AI 错误分析

以下详情页新增 Obsy AI 错误分析能力:

  • error 日志
  • APM > 链路/错误追踪

场景

  1. 定时报告:

    • 新增 Webhook 发送作为通知方式;
    • 支持将仪表板图片分享到企业微信/钉钉。
  2. 时序图:选择面积图作为图表类型后,新增堆叠模式风格,便于观察整体数据的累积效果。

APM

链路:支持列表批量导出 JSONL 格式。

RUM

用户洞察 > 漏斗分析:对于查询到的 Session 列表支持会话重放功能。

日志

  1. 查看器:
    • 日志查看器 > 索引快捷筛选在搜索栏列出显示效果优化;
    • 日志详情 > 扩展字段:新增“进行维度分析”模式;
  2. 索引:在索引的维度下支持设置专属关键字段

查看器时间控件

左侧选择时间范围与右侧刷新频率各自独立。仅两种情况会影响刷新频率:

  • 所选时间范围超过 1h
  • 所选时间是绝对时间

基础设施

主机:查看器支持调整时间范围。

Pipeline

  1. 配置页面显示优化;
  2. Pipeline 处理类型新增“事件”;
  3. 测试样本支持获取 JSON 格式。
  4. 过滤条件 > 可用性监测:支持选择多步拨测。

部署版更新

模板管理:支持上传所有查看器模板。

新增集成

  1. 新增 azure_load_balancer
  2. 重写 K8S server api
  3. 更新 Gitlab CI
  4. 翻译 Volcengine 相关视图;
  5. 翻译 AWS 相关视图。

Bug 修复

  1. 修复了日志流图导出到 CSV 无反应的问题。
  2. 修复了 ddtrace 采集的 JVM 指标视图变量为 runtime-id 字段时,时序图添加相关筛选后无数据的问题。
  3. 修复了自定义渐变区间色阶界面显示的问题。
  4. 修复了时序图编辑 DQL 查询时,过滤条件选择 >0 后保存,再次编辑时显示为空的问题。
  5. 修复了应用性能监测 > 基础设施表格图显示异常的问题。
  6. 修复了管理后台设置数据转发存储时长为 1,800 天后,前台转发规则不支持的问题。
  7. 修复了快捷查询执行 show_object_field(HOST) 时,报错 “kodo 服务 API 请求错误: Service Unavailable”的问题。
  8. 修复了快捷入口中存在的 bug 问题。
  9. 修复了 RUM 中 sessionview 无数据,而其他 resource 和 action 等有数据的问题。
  10. 修复了多步拨测创建请求步骤会立即校验必填项的问题。
  11. 修复了数据访问设置角色授权时,过滤条件不生效的问题。

2025 年 2 月 27 日

Open API 更新

指标:新增指标集和标签信息获取

功能更新

可用性监测

  1. HTTP 拨测:支持脚本模式。通过编写 Pipeline 脚本,灵活自定义拨测任务的判断条件和数据处理逻辑。
  2. 新增多步拨测:允许使用多个 API 连接的响应数据创建测试,并通过局部变量传值,链接多个任务请求。

场景

  1. 仪表板 > 可见范围:新增“自定义”配置,可配置此仪表板的“操作”、“查看”权限。同时该配置下新增“全部成员”的选项。
  2. 图表:
    • 新增基于 AI 自动生成图表标题及描述的能力;
    • 日志流图新增“规则映射”功能;
    • 表格图显示列优化;
    • 分组表格图:表达式结果支持排序;
    • 时序图、饼图等多个表格支持数据导出为 CSV 文件。

指标

  1. 指标分析 > 表格图:查询结果返回数量超过 2,000 条时,三个模式新增“查询结果计数”展示。
  2. 指标管理:支持一键跳转到指标分析。
  3. 生成指标:支持导入创建方式、支持批量导出。

基础设施

容器/ Pod 查看器:对象数据新增 cpu_usage_by_limitcpu_usage_by_requestmem_used_percent_base_limitmem_used_percent_base_request 4 个新字段。

应用性能监测

  1. Profiling > 火焰图交互优化:选中单条搜索方法名称,可直接聚焦定位。
  2. ServiceMap 交互优化:在上下游页面中,支持对当前画布中的节点进行搜索。

新增集成

  1. 新增 AWS 云账单
  2. 新增 Kube Scheduler
  3. 新增 MQTT
  4. 重写 APISIX
  5. 更新 tidb 英文文档和视图;
  6. 更新 Zookeeper 视图、补充集成图标;
  7. 修复部分组件 mainfest.yaml 英文翻译。

Bug 修复

  1. 修复了点击应用性能监测 > 链路详情 tab 页显示错误的问题;
  2. 修复了异常追踪 > Issue 回复中 @成员 有误的问题;
  3. 修复了图表中温度单位不正确的问题。

2025 年 2 月 19 日

Breaking Changes

事件 df_meta 内将不再保留 alert_info 相关信息记录。此前依赖该信息实现通知对象获取的用户,请切换至使用新增的 df_alert_info(事件告警通知)、df_is_silent(是否静默)、df_sent_target_types(事件通知对象类型)3 个字段来完成相应功能。

可能影响到的功能场景:

  1. 通过 Open API 获取事件对接外部系统的自定义使用场景
  2. 通过 Webhook 通知对象转发事件到外部系统的自定义使用场景

功能更新

PromQL 查询

新增查询类型:Instant Query,即针对单个时间点进行查询。

监控

监控器配置页面:

  1. 触发条件的逻辑匹配中新增 not between 选项;
  2. 支持直接修改监控器状态(“启用”或“禁用”)。

应用性能监测

链路:详情页新增服务上下文 tab 页。

事件

事件详情页:新增支持绑定内置视图

异常追踪

  1. Issue 新增 workingclosed 状态
  2. 针对 open 状态停留超时和未指定负责人和处理超时的情况,Issue 升级新增重复通知配置;
  3. 调整 Issue 系统评论、频道通知的 UI 显示;
  4. 分析看板:新增时间控件。

场景

  1. 图表链接:新增“查看主机监控视图”,默认关闭。
  2. 查看器:支持删除固定 name 列,用户可自定义列表显示。
  3. 云账单分析视图:支持查看账单详情。

管理

角色管理:Session Replay 查看、审计事件新增自定义添加查看权限能力。

指标

生成指标:指标名输入不再支持使用 - 中划线。

集成

集成卡片新增描述信息。

部署版更新

  1. 模板管理:支持上传基础设施查看器模板;
  2. 索引配置:弃用“备份日志”项;可在“编辑工作空间 > 数据存储策略 > 数据转发-默认存储”处配置对应存储策略。

新增集成

  1. 新增 Milvus
  2. 新增 火山云公网 IP
  3. 新增 opentelemetry-python
  4. 新增 openLIT 集成
  5. 更新 k8s\es\mongodb\rabbitmq\oracle\coredns\sqlserver 中英文监控器&视图。

Bug 修复

  1. 修复了 AI 聚合通知消息中特殊字符引起结果异常的问题;
  2. 修复了 Servicemap 部署版适配的问题;
  3. 修复了组合图表无法配置已隐藏的视图变量的问题;
  4. 修复了异常追踪 > 分析看板的"未恢复问题列表"显示错乱的问题;
  5. 修复了用户访问监测分析看板中最受欢迎页面的 P75 结果和 DQL 查询结果不一致的问题;
  6. 修复了用户访问监测 > 查看器搜索框异常的问题;
  7. 修复了场景 > 对象映射中,使用资源目录进行字段映射,看板中同一字段只有部分生效的问题;
  8. 修复了监控器 > 事件内容 UI 显示的问题;
  9. 修复了事件查看器未恢复事件快捷筛选结果不满足预期的问题。

2025 年 1 月 16 日

功能更新

用户访问监测

  1. 新增漏斗分析功能:用户可以通过定义转换步骤来创建漏斗,查看数据的转化并进行深入分析;
  2. 用户洞察模块整合:新增用户洞察模块,将热图和漏斗分析整合在该模块中,提供更全面的用户行为分析工具;
  3. 新增移动端 SourceMap 还原:Android 和 iOS 应用支持在页面上传 SourceMap 文件且在错误查看器支持查看还原后数据。

应用性能监测

APM 添加服务时,新增主机自动注入的安装引导方式,简化安装流程。

集成

  1. DataKit(数据采集工具):DataKit 安装页面新增了 Docker 方式的安装引导,提供更多样化的安装选项;
  2. 外部数据源优化:在 SLS 数据源查询时,新增了查询规范提示,帮助用户更准确地进行数据查询。

场景

组合图表优化:组合图表新增视图变量配置,支持选取当前仪表板中的视图变量作用于该组合图表,帮助更灵活地筛选和分析数据。

监控

突变检测监控器:新增对查询周期的周同比、月同比支持。

Obsy AI 智能体

新增 DataFlux Func 相关知识库。

Pipeline

自动生成 Pipeline 优化:支持同时以结构化加自然语言的方式交互获取 Pipeline 解析。

Bug 修复

  1. 修复了日志堆叠模式中的显示问题;
  2. 修复了日志检测监控器函数输入框错位的问题;
  3. 修复了指标运算有误的问题;
  4. 修复了火山引擎不支持 having 语句的问题;
  5. 修复了应用性能指标检测中,选择“请求错误率”和“平均每秒请求数”两个指标时报错的问题;
  6. 修复了火山引擎底座 not in 语句不生效的问题;
  7. 修复了事件列表返回的数据过大从而影响页面加载速度的问题;
  8. 修复了杭州站点事件一键恢复不满足预期的问题。

2025 年 1 月 8 日

Open API 更新

  1. 字段管理:支持获取字段管理列表,支持新增/修改/删除字段管理。
  2. 可用性监测:支持修改拨测任务。
  3. 异常追踪 > 日程:支持获取日程列表,支持新建/修改/删除日程。
  4. 异常追踪 > 配置管理:支持获取通知策略列表,支持新增/修改/删除通知策略;支持获取 Issue 发现列表,支持新建/修改/启用/禁用/删除 Issue 发现配置。

功能更新

日志

  1. 日志索引优化:
    • 访问日志内置视图、日志上下文 tab 页时,将分别默认选中当前日志所在的索引、default 索引,两处 tab 页均支持索引的多选,同时,在开启了跨工作空间查询,并在所属菜单选取了授权工作空间后,支持在此处直接查询对应工作空间的索引数据。最终帮助用户在一个页面完整查看所关联的日志数据,优化日志查询交互。
    • 在日志索引列出时,除 default 置顶展示之外,其余日志索引按照 A-Z 排序列出。
  2. 日志查看器新增堆叠查看模式:堆叠模式下字段将会整合在同一列, 并且这些字段在单元格内部以行的形式呈现。日志信息的展示更加紧凑和清晰,方便用户快速浏览和分析。
  3. 日志 Pipeline 优化:日志 Pipeline 的测试样本调整为获取日志的全部字段,并且需要以行协议格式填入。同时用户手动输入的日志也要遵循格式要求。

场景

  1. 表格图优化:
    • 多指标查询排序支持:当使用一个 DQL 进行多指标查询时,表格图现在支持进行排序。
    • 表格分页选择:新增了表格分页选择功能,用户可以根据数据量和查看需求,选择合适的分页大小。
  2. 组合图表:支持调整图表的顺序。
  3. 图表优化:调整了 DQL 查询组件的函数顺序,同时特别强调了 Rollup 函数的使用场景,帮助用户更好地利用 Rollup 函数进行数据聚合和分析。

管理

  1. 事件支持配置数据转发:支持配置事件类型的数据转发规则,将符合过滤条件的事件数据保存到观测云的对象存储及转发到外部存储,提供灵活管理事件数据的能力。

  2. 工作空间新增 DataKit 环境变量:工作空间支持管理 DataKit 环境变量,用户可以轻松配置和更新环境变量,实现远程同步更新 DataKit 采集配置。

  3. 查询审计事件优化:新增多个字段用于记录查询信息,同时事件内容中补充了查询的时间范围,便于追踪和分析查询行为。

Pipeline

自动生成 Pipeline 优化:更改提示出现方式,优化产品体验。

Obsy AI 智能体

Obsy AI 智能体新增生成图表:生成图表功能基于大模型自动分析用户输入的文本数据,智能生成合适的图表,解决了手动创建图表繁琐、图表选择困难等问题。

监控

告警策略:按照成员配置通知规则支持追加名称用于用途描述。

部署版更新

  1. 管理后台 > 工作空间菜单优化:
    • 工作空间列表新增主存储引擎、业务两个筛选项,支持便捷筛选工作空间;
    • 优化工作空间列表页码返回逻辑,当修改/删除某工作空间,或者修改工作空间的数据上报限制,将停留在当前页,以优化查询体验。
  2. 部署版新增参数:alertPolicyFixedNotifyTypes,支持配置告警策略中,选择“邮件”通知方式是否显示 配置参考

新增集成

  1. 新增 AWS Gateway Classic ELB
  2. 新增火山引擎 TOS 对象存储
  3. 修改 AWS Classic 采集器名称;
  4. 新增 MinIO V3集成;
  5. 更新 elasticsearch、solr、nacos、influxdb_v2、mongodb 集成(视图、文档、监控器);
  6. 更新 kubernetes 监控视图。

Bug 修复

  1. 解决了事件数据跨空间授权未生效的问题;
  2. 解决了日志关联链路跳转到链路查看器携带 trace_id 无法查询数据的问题;
  3. 解决了视图表达式查询无法进行数值填充的问题;
  4. 解决了外部事件检测监控器在变更告警策略时未产生操作审计记录的问题;
  5. 解决了事件显示列表的列宽无法调整的问题。

文档评价

文档内容是否对您有帮助? ×