更新日志(2025 年)¶
本文档记录观测云每次上线发布的更新内容说明。
2025 年 3 月 26 日¶
功能更新¶
事件¶
管理¶
数据转发:新增权限配置。通过为转发的数据设置查看权限,有效提高数据安全性。
监控¶
- 基础设施存活检测 V2:新增可配置检测区间。
- 告警策略:通知匹配逻辑调整,提升事件在命中多组策略及复杂告警策略场景下的执行效率。
- 通知对象管理:新增 Slack 和 Teams 两个通知对象,以满足全球更多用户的需求。
场景¶
- 视图变量:支持外部数据源查询。
-
图表:
- 新增“监控器总览”图表,集成监控器列表,展示最新状态,实现即时监测与异常态势感知。
- 命令面板:显示优化;
- 图表查询:在 DQL 查询中,使用 “wildcard” 或“正则”时,新增查询建议提示。
- 查看器、仪表板 > 时间控件:新增“最近 1 分钟”和“最近 5 分钟”选项。
付费计划与账单¶
- 新增月账单模块,直观展示月消费总量。
- 新增导出账单功能。
用户访问监测¶
应用列表 > 新建应用:新增“压缩上传”和“自定义托管地址”的参数配置。
可用性监测¶
新增“南非”和“中国香港”作为拨测节点,进一步扩展全球覆盖范围。
日志¶
新增集成¶
- 新增 Azure Network Interfaces;
- 新增 Azure Kubernetes;
- 新增 Azure virtual network gateway;
- 完善英文集成翻译。
Bug 修复¶
- 修复了日志页面展示利用率不高的问题。
- 修复了 Service Map 的指标单位显示问题。
- 修复了表格图多列无法选择单位的问题。
- 修复了仪表板 > 日志流图导出 CSV 时,选择 1,000 以外的导出条数会报错的问题。
- 修复了最受欢迎页面的 P75 和 DQL 查询结果不一致的问题。
- 修复了时间筛选器点击
<<
按钮后时间框仍然显示今日的问题。 - 修复了菜单管理不符合预期的问题。
- 修复了管理后台中搜索空间 ID 筛选异常的问题。
- 修复了 Pipeline 界面测试样本丢失的问题。
- 修复了配置迁移导出功能耗时过长的问题。
- 修复了升级后事件详情界面快捷筛选标签有大量空项的问题。
- 修复了监控器官方模板库检测库列表重复,且一旦选中检测库就无法搜索其他监控器的问题。
2025 年 3 月 12 日¶
Breaking Changes¶
事件 df_alert_info
字段定义调整,新增告警策略未匹配原因说明,仍然需要通过 isIgnored
做过滤判断获取实际对外发送的通知对象。
功能更新¶
异常追踪¶
管理¶
- 云账号管理:新增阿里云云账号授权类型。
- API Key 管理:新增对 API Key 的权限控制功能,支持添加角色授权。通过角色授权,API Key 仅具备角色范围内的操作权限,从而有效降低安全风险。
- 数据转发:默认交互变更为不选中规则。
AI 错误分析¶
以下详情页新增 AI 错误分析能力:
- error 日志
- APM > 链路/错误追踪
场景¶
-
定时报告:
- 新增 Webhook 发送作为通知方式;
- 支持将仪表板图片分享到企业微信/钉钉。
-
时序图:选择面积图作为图表类型后,新增堆叠模式风格,便于观察整体数据的累积效果。
APM¶
链路:支持列表批量导出 JSONL 格式。
RUM¶
用户洞察 > 漏斗分析:对于查询到的 Session 列表支持会话重放功能。
日志¶
- 查看器:
- 日志查看器 > 索引快捷筛选在搜索栏列出显示效果优化;
- 日志详情 > 扩展字段:新增“进行维度分析”模式;
- 索引:在索引的维度下支持设置专属关键字段。
查看器时间控件¶
左侧选择时间范围与右侧刷新频率各自独立。仅两种情况会影响刷新频率:
- 所选时间范围超过 1h
- 所选时间是绝对时间
基础设施¶
主机:查看器支持调整时间范围。
Pipeline¶
- 配置页面显示优化;
- Pipeline 处理类型新增“事件”;
- 测试样本支持获取 JSON 格式。
- 过滤条件 > 可用性监测:支持选择多步拨测。
部署版更新¶
模板管理:支持上传所有查看器模板。
新增集成¶
- 新增 azure_load_balancer;
- 重写 K8S server api;
- 更新 Gitlab CI;
- 翻译 Volcengine 相关视图;
- 翻译 AWS 相关视图。
Bug 修复¶
- 修复了日志流图导出到 CSV 无反应的问题。
- 修复了
ddtrace
采集的 JVM 指标视图变量为runtime-id
字段时,时序图添加相关筛选后无数据的问题。 - 修复了自定义渐变区间色阶界面显示的问题。
- 修复了时序图编辑 DQL 查询时,过滤条件选择 >0 后保存,再次编辑时显示为空的问题。
- 修复了应用性能监测 > 基础设施表格图显示异常的问题。
- 修复了管理后台设置数据转发存储时长为 1,800 天后,前台转发规则不支持的问题。
- 修复了快捷查询执行 show_object_field(
HOST
) 时,报错 “kodo 服务 API 请求错误: Service Unavailable”的问题。 - 修复了快捷入口中存在的 bug 问题。
- 修复了 RUM 中
session
和view
无数据,而其他resource
和 action 等有数据的问题。 - 修复了多步拨测创建请求步骤会立即校验必填项的问题。
- 修复了数据访问设置角色授权时,过滤条件不生效的问题。
2025 年 2 月 27 日¶
OpenAPI 更新¶
指标:新增指标集和标签信息获取。
功能更新¶
可用性监测¶
- HTTP 拨测:支持脚本模式。通过编写 Pipeline 脚本,灵活自定义拨测任务的判断条件和数据处理逻辑。
- 新增多步拨测:允许使用多个 API 连接的响应数据创建测试,并通过局部变量传值,链接多个任务请求。
场景¶
- 仪表板 > 可见范围:新增“自定义”配置,可配置此仪表板的“操作”、“查看”权限。同时该配置下新增“全部成员”的选项。
- 图表:
- 新增基于 AI 自动生成图表标题及描述的能力;
- 日志流图新增“规则映射”功能;
- 表格图显示列优化;
- 分组表格图:表达式结果支持排序;
- 时序图、饼图等多个表格支持数据导出为 CSV 文件。
指标¶
- 指标分析 > 表格图:查询结果返回数量超过 2,000 条时,三个模式新增“查询结果计数”展示。
- 指标管理:支持一键跳转到指标分析。
- 生成指标:支持导入创建方式、支持批量导出。
基础设施¶
容器/ Pod 查看器:对象数据新增 cpu_usage_by_limit
、cpu_usage_by_request
、mem_used_percent_base_limit
、mem_used_percent_base_request
4 个新字段。
应用性能监测¶
- Profiling > 火焰图交互优化:选中单条搜索方法名称,可直接聚焦定位。
- ServiceMap 交互优化:在上下游页面中,支持对当前画布中的节点进行搜索。
新增集成¶
- 新增 AWS 云账单;
- 新增 Kube Scheduler;
- 新增 MQTT;
- 重写 APISIX;
- 更新 tidb 英文文档和视图;
- 更新 Zookeeper 视图、补充集成图标;
- 修复部分组件 mainfest.yaml 英文翻译。
Bug 修复¶
- 修复了点击应用性能监测 > 链路详情 tab 页显示错误的问题;
- 修复了异常追踪 > Issue 回复中
@成员
有误的问题; - 修复了图表中温度单位不正确的问题。
2025 年 2 月 19 日¶
Breaking Changes¶
事件 df_meta
内将不再保留 alert_info
相关信息记录。此前依赖该信息实现通知对象获取的用户,请切换至使用新增的 df_alert_info
(事件告警通知)、df_is_silent
(是否静默)、df_sent_target_types
(事件通知对象类型)3 个字段来完成相应功能。
可能影响到的功能场景:
- 通过 OpenAPI 获取事件对接外部系统的自定义使用场景
- 通过 Webhook 通知对象转发事件到外部系统的自定义使用场景
功能更新¶
PromQL 查询¶
新增查询类型:Instant Query,即针对单个时间点进行查询。
监控¶
监控器配置页面:
- 触发条件的逻辑匹配中新增
not between
选项; - 支持直接修改监控器状态(“启用”或“禁用”)。
应用性能监测¶
链路:详情页新增服务上下文 tab 页。
事件¶
事件详情页:新增支持绑定内置视图;
异常追踪¶
- Issue 新增
working
、closed
状态; - 针对
open
状态停留超时和未指定负责人和处理超时的情况,Issue 升级新增重复通知配置; - 调整 Issue 系统评论、频道通知的 UI 显示;
- 分析看板:新增时间控件。
场景¶
- 图表链接:新增“查看主机监控视图”,默认关闭。
- 查看器:支持删除固定
name
列,用户可自定义列表显示。 - 云账单分析视图:支持查看账单详情。
管理¶
角色管理:Session Replay 查看、审计事件新增自定义添加查看权限能力。
指标¶
生成指标:指标名输入不再支持使用 -
中划线。
集成¶
集成卡片新增描述信息。
部署版更新¶
- 模板管理:支持上传基础设施查看器模板;
- 索引配置:弃用“备份日志”项;可在“编辑工作空间 > 数据存储策略 > 数据转发-默认存储”处配置对应存储策略。
新增集成¶
- 新增 Milvus;
- 新增 火山云公网 IP;
- 新增 opentelemetry-python;
- 新增 openLIT 集成;
- 更新 k8s\es\mongodb\rabbitmq\oracle\coredns\sqlserver 中英文监控器&视图。
Bug 修复¶
- 修复了 AI 聚合通知消息中特殊字符引起结果异常的问题;
- 修复了 Servicemap 部署版适配的问题;
- 修复了组合图表无法配置已隐藏的视图变量的问题;
- 修复了异常追踪 > 分析看板的"未恢复问题列表"显示错乱的问题;
- 修复了用户访问监测分析看板中最受欢迎页面的 P75 结果和 DQL 查询结果不一致的问题;
- 修复了用户访问监测 > 查看器搜索框异常的问题;
- 修复了场景 > 对象映射中,使用资源目录进行字段映射,看板中同一字段只有部分生效的问题;
- 修复了监控器 > 事件内容 UI 显示的问题;
- 修复了事件查看器未恢复事件快捷筛选结果不满足预期的问题。
2025 年 1 月 16 日¶
功能更新¶
用户访问监测¶
- 新增漏斗分析功能:用户可以通过定义转换步骤来创建漏斗,查看数据的转化并进行深入分析;
- 用户洞察模块整合:新增用户洞察模块,将热图和漏斗分析整合在该模块中,提供更全面的用户行为分析工具;
- 新增移动端 SourceMap 还原:Android 和 iOS 应用支持在页面上传 SourceMap 文件且在错误查看器支持查看还原后数据。
应用性能监测¶
APM 添加服务时,新增主机自动注入的安装引导方式,简化安装流程。
集成¶
- DataKit(数据采集工具):DataKit 安装页面新增了 Docker 方式的安装引导,提供更多样化的安装选项;
- 外部数据源优化:在 SLS 数据源查询时,新增了查询规范提示,帮助用户更准确地进行数据查询。
场景¶
组合图表优化:组合图表新增视图变量配置,支持选取当前仪表板中的视图变量作用于该组合图表,帮助更灵活地筛选和分析数据。
监控¶
突变检测监控器:新增对查询周期的周同比、月同比支持。
AI 智能助手¶
新增 DataFlux Func 相关知识库。
Pipeline¶
自动生成 Pipeline 优化:支持同时以结构化加自然语言的方式交互获取 Pipeline 解析。
Bug 修复¶
- 修复了日志堆叠模式中的显示问题;
- 修复了日志检测监控器函数输入框错位的问题;
- 修复了指标运算有误的问题;
- 修复了火山引擎不支持
having
语句的问题; - 修复了应用性能指标检测中,选择“请求错误率”和“平均每秒请求数”两个指标时报错的问题;
- 修复了火山引擎底座
not in
语句不生效的问题; - 修复了事件列表返回的数据过大从而影响页面加载速度的问题;
- 修复了杭州站点事件一键恢复不满足预期的问题。
2025 年 1 月 8 日¶
OpenAPI 更新¶
- 字段管理:支持获取字段管理列表,支持新增/修改/删除字段管理。
- 可用性监测:支持修改拨测任务。
- 异常追踪 > 日程:支持获取日程列表,支持新建/修改/删除日程。
- 异常追踪 > 配置管理:支持获取通知策略列表,支持新增/修改/删除通知策略;支持获取 Issue 发现列表,支持新建/修改/启用/禁用/删除 Issue 发现配置。
功能更新¶
日志¶
- 日志索引优化:
- 访问日志内置视图、日志上下文 tab 页时,将分别默认选中当前日志所在的索引、
default
索引,两处 tab 页均支持索引的多选,同时,在开启了跨工作空间查询,并在所属菜单选取了授权工作空间后,支持在此处直接查询对应工作空间的索引数据。最终帮助用户在一个页面完整查看所关联的日志数据,优化日志查询交互。 - 在日志索引列出时,除
default
置顶展示之外,其余日志索引按照 A-Z 排序列出。
- 访问日志内置视图、日志上下文 tab 页时,将分别默认选中当前日志所在的索引、
- 日志查看器新增堆叠查看模式:堆叠模式下字段将会整合在同一列, 并且这些字段在单元格内部以行的形式呈现。日志信息的展示更加紧凑和清晰,方便用户快速浏览和分析。
- 日志 Pipeline 优化:日志 Pipeline 的测试样本调整为获取日志的全部字段,并且需要以行协议格式填入。同时用户手动输入的日志也要遵循格式要求。
场景¶
- 表格图优化:
- 多指标查询排序支持:当使用一个 DQL 进行多指标查询时,表格图现在支持进行排序。
- 表格分页选择:新增了表格分页选择功能,用户可以根据数据量和查看需求,选择合适的分页大小。
- 组合图表:支持调整图表的顺序。
- 图表优化:调整了 DQL 查询组件的函数顺序,同时特别强调了 Rollup 函数的使用场景,帮助用户更好地利用 Rollup 函数进行数据聚合和分析。
管理¶
-
事件支持配置数据转发:支持配置事件类型的数据转发规则,将符合过滤条件的事件数据保存到观测云的对象存储及转发到外部存储,提供灵活管理事件数据的能力。
-
工作空间新增 DataKit 环境变量:工作空间支持管理 DataKit 环境变量,用户可以轻松配置和更新环境变量,实现远程同步更新 DataKit 采集配置。
-
查询审计事件优化:新增多个字段用于记录查询信息,同时事件内容中补充了查询的时间范围,便于追踪和分析查询行为。
Pipeline¶
自动生成 Pipeline 优化:更改提示出现方式,优化产品体验。
AI 智能助手¶
AI 智能助手新增生成图表:生成图表功能基于大模型自动分析用户输入的文本数据,智能生成合适的图表,解决了手动创建图表繁琐、图表选择困难等问题。
监控¶
告警策略:按照成员配置通知规则支持追加名称用于用途描述。
部署版更新¶
- 管理后台 > 工作空间菜单优化:
- 工作空间列表新增主存储引擎、业务两个筛选项,支持便捷筛选工作空间;
- 优化工作空间列表页码返回逻辑,当修改/删除某工作空间,或者修改工作空间的数据上报限制,将停留在当前页,以优化查询体验。
- 部署版新增参数:
alertPolicyFixedNotifyTypes
,支持配置告警策略中,选择“邮件”通知方式是否显示 配置参考。
新增集成¶
- 新增 AWS Gateway Classic ELB;
- 新增火山引擎 TOS 对象存储;
- 修改 AWS Classic 采集器名称;
- 新增 MinIO V3集成;
- 更新 elasticsearch、solr、nacos、influxdb_v2、mongodb 集成(视图、文档、监控器);
- 更新 kubernetes 监控视图。
Bug 修复¶
- 解决了事件数据跨空间授权未生效的问题;
- 解决了日志关联链路跳转到链路查看器携带
trace_id
无法查询数据的问题; - 解决了视图表达式查询无法进行数值填充的问题;
- 解决了外部事件检测监控器在变更告警策略时未产生操作审计记录的问题;
- 解决了事件显示列表的列宽无法调整的问题。