跳转至

更新日志(2023 年)


本文档记录观测云每次上线发布的更新内容说明,包括 DataKit、观测云最佳实践、观测云集成文档和观测云。

2023 年 12 月 28 日

观测云更新

  • 监控:
    • 新增用户访问智能检测:支持网站/ APP 的性能异常、错误分析,相关检测指标有 LCP、FID、CLS 等;
    • 基础设施存活检测 V2:新增基础设施存活 V2 版本,优化检测逻辑,解决 V1 和进程检测相关的若干触发问题。
  • 用户访问监测(RUM):
    • 新增公网 DataWay的方式接收 RUM 数据,无需安装采集器; Web 类型应用支持在控制台中直接上传 SourceMap,可以基于不同的版本和环境上传多个文件。
    • 错误查看器 > 错误详情:新增格式化错误信息页面,展示 Sourcemap 文件解析后的错误信息,支持切换查看格式化和原始格式的错误信息。若未配置 Sourcemap 文件或上传后未匹配,则只显示原始格式错误信息。
  • 应用性能监测(APM):
    • 优化服务拓扑图:调整查看上下游、节点、服务名等展示样式;
    • 优化服务详情:绑定性能视图仪表板展示当前服务性能指标,同样支持自定义同名用户视图覆盖更新,支持下钻分析;
    • 优化链路详情火焰图、瀑布图展示:火焰图新增执行时间和执行占比显示;瀑布图支持相对时间和绝对时间切换展示。
  • 图表优化:
    • 时序表格图新增显示列配置:支持用户设置查询数据显示列,同时支持用户自定义手输列名;支持用户在编辑模式下手动调整列宽,保存后可根据列宽展示列表信息;支持拖拽调整显示列顺序;
    • 图表链接新增值变量做链接跳转使用。
  • 仪表板:
    • 仪表板新增主页仪表板:支持工作空间配置主页仪表板;
  • 基础设施:
    • 主机查看器新增仅显示在线主机开关过滤:获取主机在线列表逻辑优化,支持选择是否仅列出最近 10 分钟有数据上报的主机列表。

观测云部署版更新

  • 支持外部平台嵌套观测云页面,可使用 URL 里的参数设置隐藏左侧和头部菜单栏、支持隐藏悬浮操作;
  • 支持外部平台通过 iframe 嵌套观测云仪表板或查看器页面。

新增集成

  • 新增集成 Kubecost

2023 年 12 月 14 日

观测云更新

  • 监控:
    • 新增智能监控
      • 主机智能检测:支持 CPU 的突增/突降/区间上升,内存的突增/突降/区间上升检测;
      • 日志智能检测:支持日志数量的突增/突降,错误日志的突增检测;
      • 应用智能检测:支持请求数量突增/突降,错误请求数量突增,请求延迟的突增/突降/区间上升检测。
    • 突变检测:新增触发规则前提条件,当检测值满足该条件时进行突变检测规则,提升监控精准度。
  • 付费计划与账单:
    • 新增数据转发使用分析列表:查看当前工作空间所有数据转发规则的转发数量。若转发规则是到观测云备份日志的模块,会显示对应的保存策略。同时,支持时间控件筛选所需的数据转发情况列表,方便快速查看历史日志的备份整体情况。
  • 事件:
    • 新增智能监控事件查看器:可查看智能监控产生的全部事件信息。
  • 日志:
    • 数据访问新增【仅显示跟我相关规则】配置:开启后仅显示影响当前账号数据查询的访问规则。
    • 日志 > 查看器:新增数据访问规则限制提示。
  • 基础设施 > 容器 > Kubernetes
    • 新增 Kubernetes 分析看板:容器对象分析看板,帮助您从不同维度了解 Kubernetes 中的各基础设施情况。
    • 容器 > 查看器:页面 UI 优化。
  • 指标:
    • 指标 > 查看器
      • 表格图新增【查询工具】模式:返回结果与快捷入口 > 查询工具保持一致;若添加多个查询,默认返回第一条查询结果;该模式下支持最多导出 1000 条查询记录。
      • 新增查询条件【复制】功能,优化页面体验。
      • 查询组件优化:简单查询的【by 分组】支持自由拖动调整顺序。
  • 查看器:
    • 调整所有查看器,分析模式下隐藏趋势图显示。
  • SSO:
    • 优化 SSO 用户工作空间列出逻辑,修复因无访问权限自动退出登录的问题。

观测云部署版更新

  • 新增告警通知独立发送配置:开启此配置后,告警策略选择【告警不聚合】选项时,每条事件都会发送一份告警通知,帮助您高效管理告警通知。
  • 新增事件链接免登查看配置:开启此配置后,所有工作空间发送的告警通知内置的事件关联链接都可以免登访问。若关闭该配置,则历史发送的免登链接都会失效,保障数据安全。
  • 优化【定时报告】:支持查询范围自定义配置,上限由 30 天调整为 360 天,满足您所需定时报告的拓展需求。

新增/更新集成

  • 新增 APISIX
  • 更新 阿里云 KafKa
  • 更新 达梦

2023 年 11 月 30 日

观测云更新

  • 监控:
    • 新建监控器 > 事件内容 > 插入链接:支持根据检测指标自动生成跳转链接,可在插入链接后调整过滤条件和时间范围;支持自定义跳转链接。
    • 告警策略管理:新增【智能聚合】模式,您可以根据 "标题" 或 "内容" 聚类分组周期内产生的事件,每个分组将产生一条告警通知。
  • 管理:
    • 该模块菜单页面整体风格优化。
    • 新增【属性声明】:通过固定字段 organizationbusiness 帮助在全局中快速识别并进行联动查询。
    • 新增【正则表达式】:可切换查看【自定义】和【模版库】列表;其中支持用户自定义正则表达式模板并应用到【快照分享】和【数据访问规则】。
    • 工单管理
      • 工单由“账号级别”调整为“工作空间级别”,所有成员都可以查看工作空间内的全部工单;
      • 新增【所有工单】列表、【提交人】以及【我的工单】列表。
    • 空间管理:解散空间操作新增风险确认提示。
    • 工作空间【描述】功能下线处理。
    • 数据转发:查询和统计调整优化
      • 查询侧:调整内容显示数据范围,默认显示除 time 以外的其他数据内容;
      • 针对数据转发功能做了一些健壮性优化。
  • 日志:
    • 数据访问
      • 新增数据脱敏规则,支持配置多个字段并应用多个正则表达式;
      • 支持配置全部【索引】和【角色】;
      • 新增脱敏预览,以便判断规则是否能满足需求。
  • 快照 > 分享快照
    • 分享链接有效时间新增 1、3、7天,默认选中 1 天;
    • 数据脱敏:支持配置多个字段并应用多个正则表达式;
    • 支持预览快照,您可以提前查看所有已配置的页面效果。
  • RUM:【新建应用】页面布局调整,优化使用体验。
  • 聚类分析:
    • RUM > Error 查看器 & APM > 错误追踪:聚类分析模式下调整为 drain() 算法聚合逻辑;新增输入框可修改聚类字段,默认为 error_message,最多可输入3个字段,也可根据需要自定义聚类字段。

观测云部署版更新

  • 新增支持自定义邮件首尾以及 Logo 等显示文案;
  • 观测云将取消 Banner 信息的设置,不再提供维护 Banner 信息的相关支持。

新增集成

  • 新增 logstash

新增最佳实践

  • 异常追踪与 JIRA 实现双向联动最佳实践

2023 年 11 月 21 日

观测云更新

  • 管理:【设置】页面新增 MFA 安全认证开关,一旦管理员/拥有者开启该功能,所有用户(普通成员 / SSO 成员)需完成 MFA 认证后才能进入空间。

观测云部署版更新

  • 新增 MFA 安全认证开关,支持通过系统默认或自定义两种方式进行身份认证。

2023 年 11 月 16 日

观测云更新

  • 监控器:
    • 【告警沉默】功能回归,仍可通过告警沉默配置定义重复告警通知的时间间隔。
    • 删除 ”紧急“、”重要“、”警告“触发条件必须配置任意一项的限制,现支持任意配置紧急、重要、警告、数据断档、信息的其中一种触发条件。
    • 基础设施存活监测:支持指标配置基础设施的存活检测,可通过此模式定义检测频率更高的存活检测配置。
  • 场景
    • 图表:
      • 高级设置:【原始间隔】参数配置下线,默认配置调整为【自动对齐】,支持自定义选择图表默认情况下数据的时间间隔。
      • 时序图:【显示密度】调整为【最大返回点数】,默认值为 720,支持定义 2-1000 之间的任意整数。
      • 修复了 PromQL 联动视图变量后导致别名功能失效的问题。
    • 服务管理
      • 新增内置切换下拉框,您可直接在此处选择切换服务无需回到清单列表。
      • 详情页中 POD 页面下线。
      • 【资源调用】性能图表变更为组合图表显示,优化页面展示体验。
  • 管理
    • SSO 管理
      • SSO 登录时,工作空间支持列出当前【身份提供商 ID】下所有授权的工作空间;支持通过【搜索】功能直接定位目标工作空间。
      • 【用户 SSO】 新增【导入/导出】功能,从而快速配置多个工作空间单点登录配置。
    • 工作空间语言
      • 控制台默认显示语言逻辑调整,默认跟随浏览器语言显示配置。
      • 当修改工作空间语言版本时,事件、告警、短信等通知模版也将使用修改后的语言模版。
  • 事件关联异常追踪新增联动标识:
    • 未恢复事件列表中可通过图标了解当前事件是否关联了某个异常追踪。
    • 异常追踪:若存在由监控器同步创建关联的事件信息,可通过图标快速了解关联的事件数量。
  • 基础设施 > 主机:优化主机查看器指标数据排序不准的问题。
  • Pipeline 使用体验的若干优化:
    • 数据来源选择列新增已配置过 Pipeline 脚本的文案提示;
    • 日志数据获取测试样本新增 ”索引“ 选择,解决用户未使用默认索引导致获取不到样本数据问题。

观测云部署版更新

  • 单点登录:支持用户账号通过 OIDC 登录时,根据返回的用户信息动态追加手机号信息。

新增集成

  • 新增 argocdfluentdredis-sentinel

2023 年 11 月 9 日

观测云更新

  • 监控器 > 告警策略管理
    • 通知配置:逻辑更改为针对单个异常等级配置单个或多个通知对象。
    • 恢复通知逻辑变更:当历史发送的异常告警事件恢复后,观测云会发送恢复通知到对应通知对象。
    • 新增【告警聚合】:支持基于规则配置告警通知聚合,聚合方式有两种:
      • 不聚合:该模式下,按照每 20 秒时间间隔合并为一封告警通知发送至对应通知对象;
      • 规则聚合:可选择四种聚合规则并基于聚合周期来发送告警通知。
    • 新增【聚合周期】:在规则聚合的模式下,1-30 分钟内的新增事件会聚合成通知发送,超出聚合周期的新增事件将被聚合到新的告警通知。
  • 管理 > 数据转发:支持自定义时间范围查询,可选择多个日期及定义开始时间和结束时间。

2023 年 11 月 2 日

观测云更新

  • 管理:
    • SSO 管理:支持 OIDC / Oauth2.0 协议的单点登录配置
    • 数据权限管理:添加授权时新增【角色】,配置角色后,被授权的工作空间做数据查看时会根据选择的角色范围,判断数据的查询访问限制和脱敏限制。
  • 数据转发:
    • 导航位置调整至【管理】模块,仍可通过原【日志】、【用户访问监测】、【应用性能监测】的导航栏二级菜单进入【数据转发】;
    • AWS S3阿里云 OSS 支持“跨账号授权”配置,实现两个账号之间互相授权数据权限,简化了配置流程。
  • 付费计划与账单:
    • 支持数据转发到观测云内部存储,统计每天出账时工作空间内保存到观测云存储对象的数据容量大小;
  • 事件 > 未恢复事件
    • 目前,未恢复事件列表保存近 24 小时内的事件数据;
    • 新增显示偏好:默认展示【标准】模式,支持选择【扩展】模式来打开事件检测结果值历史趋势;
    • 支持将当前事件列表导出 CSV;
    • 事件详情页新增扩展字段 Tab 页;基础属性Tab 页页面优化。
  • 基础设施 > 网络
    • 优化【总览】模板,新增快捷筛选,用户可以过滤查看网络路径。新增 5 个统计图表,支持分析发送/接收字节数、TCP 重传等网络指标信息;
    • 新增【网络流】查看器,可以查看时间线上的所有 L4(netflow)、L7(httpflow) 网络流数据;
    • 其他查看器详情页新增【拓扑】模式展示,可直接查看当前对象的网络上下游关系以及一些网络关键指标。
  • 场景:
    • 视图变量:支持添加 PromQL 方式查询
    • 图表:
      • 针对 Doris 数据存储的工作空间新增【数据采样】;
      • 时间自动对齐功能优化:针对所有指标数据和 Doris 数据的图表查询,当开启时间自动对齐功能时,返回数据的时间点将按“整秒/整分/整小时”对齐;
      • 排行榜、概览图、表格图:新增【规则映射】,可为映射数值范围内的数据配置相应的字体色/背景色。
    • 查看器:分析模式优化,在支持基于数据自由地进行聚合查询,并以图表形式展示分析;
    • 服务管理 > 资源调用:资源排行榜新增【每秒请求数】选项。
  • 可用性监测 > 任务:支持导入、导出。
  • Doris 日志数据引擎下暂不支持 with_labels 联动查询。

观测云部署版更新

  • 支持账号会话失效时长自定义配置,对前台用户统一设置登录会话保持时间

2023 年 10 月 19 日

观测云更新

  • 付费计划与账单:计费项【数据转发】统计逻辑变更为 “按照数据转发规则” 统计转发数据量大小。
  • 管理
    • SSO 管理:支持创建多个 SSO 的 IDP 配置,并支持针对单个 IDP 配置进行启用、禁用操作、开启 SAML 映射。
    • 数据权限管理 > 敏感数据脱敏:支持基于角色级别配置敏感数据屏蔽规则,配置时可采用正则表达式脱敏,支持针对某个数据类型下的字段做脱敏规则配置,并由此新增脱敏规则预览测试。
  • 监控器:新增外部事件检测,将第三方系统产生的异常事件或记录通过指定 URL 地址,以 POST 请求方式发送到 HTTP 服务器后生成观测云的事件数据。
  • 场景
    • 服务管理 > 资源调用:新增针对对应列表进行数量排序,默认从大到小;
    • 图表链接:新增基于当前选中数据点的开始时间和结束时间做传参,变量分别为 #{timestamp.start}#{timestamp.end}
    • 图表别名:基于图例序列进行配置;
    • 表格图:新增【时序表格图】。
  • 指标 > 指标分析:表格图新增【时序模式】。

观测云部署版更新

  • 新增自定义映射规则配置:启用该配置后,对应工作空间可以自定义映射规则。工作空间的自定义映射规则优先级大于管理后台的映射规则;
  • 新增查询数量上限:针对不同用户的工作空间的查询数量有定制化的限制,避免因查询数据量过大导致集群查询性能低,影响产品使用体验;
  • 本地账号新增更换密码。

集成更新

  • 异常事件与 PagerDuty 联动:当我们的应用程序或系统出现异常时,通常需要及时处理以保证系统的正常运行。为了更好地管理和跟踪异常事件,我们可以将这些事件发送到 PagerDuty 中创建事件,这样我们就可以在 PagerDuty 中进行跟踪、分析和解决这些问题,通过快速地将异常事件发送到 PagerDuty 中创建事件,为我们提供更好的管理和跟踪异常事件的能力,从而更好地保证系统的正常运行。同时,这种方法也可以帮助我们更好地分析和解决问题,提高系统的稳定性和可靠性。

2023 年 9 月 26 日

观测云更新

  • 场景 > 服务管理:资源调用新增【上下游拓扑】组件,用户可查看当前资源的上下游资源调用关系。
  • 日志 > 数据转发:数据转发规则查询支持 RUM、APM 数据。

2023 年 9 月 21 日

观测云更新

  • 日志:
    • 数据转发:新增外部存储转发规则数据查询;支持启用/禁用转发规则;
    • 绑定索引:日志易新增标签绑定,从而实现更细颗粒度的数据范围查询授权能力。
  • 基础设施 > 自定义
    • 【默认属性】这一概念更改为【必有属性】:上报的数据中必须包含该属性字段,否则将会上报失败;
    • 支持将资源目录添加至二级菜单,便于查看。
    • 自定义查看器新增快捷筛选。
  • 场景:
    • 定时报告:新增【钉钉】【企业微信】【飞书】三种通知方式;
    • 图表:【时序图、饼图、柱状图、直方图、散点图、气泡图、表格图、矩形树图、漏斗图、排行榜、地图、蜂窝图】新增数据格式,可以定义【小数位数】以及【千分位分隔符】。
  • 监控 > 通知对象管理:邮件组类型下架,已创建的不受影响。
  • 快照:分享快照:新增 IP 白名单访问限制。
  • 异常追踪:【等级】支持自定义创建;支持启用/禁用默认等级。
  • 集成 > 扩展:DataFlux Func 托管版和 RUM Headless 现支持海外站点:俄勒冈,法兰克福,新加坡。

集成更新

华为云:

  • Huawei CCE:观测云支持对 CCE 中各类资源的运行状态和服务能力进行监测,包括 Containers、Pods、Services、Deployments、Clusters、Nodes、Replica Sets、Jobs、Cron Jobs 等。您可以在 Kubernetes 中通过 DaemonSet 方式安装 DataKit,进而完成对 Kubernetes 资源的数据采集。最终,在观测云中实时监测 Kubernetes 各类资源的运行情况。

  • Huawei CSS(Elasticsearch):华为云搜索服务 CSS for Elasticsearch 的核心性能指标包括查询延迟、索引速度、搜索速度、磁盘使用率和 CPU 使用率,这些都是评估和优化 Elasticsearch 性能的关键指标。

  • Huawei SYS.AS:华为 SYS.AS 的核心性能指标包括 CPU 利用率、内存使用率、磁盘I/O、网络吞吐量和系统负载等,这些都是评估和优化自动缩放系统性能的关键指标。

  • Huawei ASM:华为云的 ASM 的链路追踪数据输出到观测云,进行查看、分析。

AWS:

  • AWS CloudFront:AWS CloudFront 的核心性能指标包括请求总数、数据传输量、HTTP 错误率、缓存命中率和延迟,这些可以帮助用户评估和优化内容分发网络的性能。

  • AWS MediaConvert:AWS MediaConvert 包括数据传输、视频报错、作业数、填充等。

  • AWS Aurora Serverless V2:AWS Aurora Serverless V2,包括连接数、IOPS、队列、读写延迟、网络吞吐量等。

  • AWS Redshift:AWS Redshift 的核心性能指标包括查询性能、磁盘空间使用率、CPU 利用率、数据库连接数和磁盘 I/O 操作,这些都是评估和优化数据仓库性能的关键指标。

  • AWS Simple Queue Service:AWS Simple Queue Service 的展示指标包括队列中最旧的未删除消息的大约存在时间、延迟且无法立即读取的消息数量、处于空中状态的消息的数量、可从队列取回的消息数量等。

  • AWS Timestream:AWS Timestream 的展示指标包括系统错误数(内部服务错误数)、当前 AWS 区域和当前 AWS 帐户的无效请求的总和、成功请求经过的时间和样本数量、存储在内存中的数据量以及存储在磁存储器中的数据量等。

  • AWS Neptune Cluster:AWS Neptune Cluster 的展示指标包括冷启动时间、执行时间、并发执行数和内存使用量,这些指标反映了 Neptune Cluster函数的响应速度、可扩展性和资源利用情况。

2023 年 9 月 7 日

观测云更新

  • 场景 > 仪表板/查看器:新增全局跨工作空间查询配置。
  • 场景 > 图表查询:时间控件范围小于等于【最近 15 分钟】,自动对齐时间间隔新增 “1 秒”显示。
  • 场景 > 服务管理
    • 服务清单新增绑定多个内置视图到分析看板;新增关联、团队信息;
    • 新增资源调用分析看板;
    • 支持保存快照。
  • 日志 > 备份日志:
    • 正式更改为数据转发
    • 新增链路、用户访问数据源;
    • 原备份日志计费项名称更改为数据转发计费项。
  • 日志 > 查看器:新增新建监控器入口;支持针对查看器详情页做快照保存。
  • 管理:
    • 全局标签:新增全局标签功能,对标签进行统一管理;
    • 字段管理:新增别名、设置显示列;
    • 空间管理:功能整合和页面优化;
    • 成员管理:原成员组的定义正式更改为团队;
    • 敏感数据扫描:新增扫描规则数量统计;新增跳转链接。
  • 监控:
    • 可用性数据检测:新增拨测指标,可以基于【指标】维度进行检测;
    • 突变、离群、区间检测:支持选择所有数据源。

集成更新

阿里云:

  • aliyun_analyticdb_postgresql:阿里云 AnalyticDB PostgreSQL 指标展示,包括 CPU、内存、磁盘、协调节点、实例查询等。
  • aliyun_clickhouse_community:阿里云 ClickHouse 指标展示,包括服务状态、日志流量、操作次数、总体 QPS 等。
  • aliyun_kafka:阿里云 KafKa 包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 Kafka 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
  • aliyun_lindorm:包括高吞吐量、低延迟的数据读写能力,支持高并发的事务处理,以及强一致性和高可靠性的数据存储和查询服务。
  • aliyun_polardb_1.0:阿里云 PolarDB 分布式 1.0 展示指标包括CPU利用率、内存利用率、网络带宽和磁盘 IOPS。
  • aliyun_polardb_2.0:阿里云 PolarDB 分布式 2.0 展示计算层和存储节点的指标,包括 CPU 利用率、连接使用率、磁盘使用量、磁盘使用率、内存利用率、网络带宽等。
  • aliyun_rds_postgresql:阿里云 RDS PostgreSQL 指标展示,包括 CPU 使用率、内存使用率等。
  • aliyun_rocketmq5:阿里云 RocketMQ 5.0 的展示指标包括消息吞吐量、延迟、可靠性和水平扩展能力等。

AWS:

  • aws_dynamodb_DAX:AWS DynamoDB DAX 的展示指标包括节点或集群的 CPU 使用率、在所有网络接口上收到或发出的字节数、数据包的数量等,这些指标反映了 DynamoDB DAX 的运行状态。
  • aws_memorydb:AWS MemoryDB 的核心性能指标包括低延迟的内存读写能力、高并发的事务处理能力,以及可线性扩展的存储容量和吞吐量。

华为云:

  • huawei_functiongraph:HUAWEI FunctionGraph 的展示指标包括调用次数,错误次数,被拒绝次数,并发数,预留实例个数,运行时间(包括最大运行时间、最小运行时间、平均运行时间)等,这些指标反映了 FunctionGraph 函数运行情况。
  • huawei_kafka:包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 Kafka 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
  • huaweiyun_SYS_DDMS:'华为云 SYS.DDMS 监控视图展示指标包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 DDMS 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。

腾讯云:

  • tencent_keewidb:腾讯云 KeeWiDB 指标展示,包括连接数、请求、缓存、key、慢查询等。
  • tencent_mariadb:包括高性能的读写能力、低延迟的查询响应时间,以及支持高并发的事务处理和扩展性能。
  • tencent_memcached:包括高速的内存读写能力、低延迟的数据访问时间,以及高并发的访问处理能力。
  • tencent_tdsql_c_mysql:包括高吞吐量的读写能力、低延迟的查询响应时间,以及支持高并发的事务处理和可扩展性能。

其他:

  • openai:OpenAI的展示指标包括请求总数,响应时间,请求数量,请求错误数和消耗token数。
  • monitor_jira:当我们的应用程序或系统出现异常时,通常需要及时处理以保证系统的正常运行。为了更好地管理和跟踪异常事件,我们可以将这些事件发送到 Jira 中创建事件,这样我们就可以在 Jira 中进行跟踪、分析和解决这些问题,通过快速地将异常事件发送到 Jira 中创建事件,为我们提供更好的管理和跟踪异常事件的能力,从而更好地保证系统的正常运行。同时,这种方法也可以帮助我们更好地分析和解决问题,提高系统的稳定性和可靠性。

2023 年 8 月 29 日

观测云更新

  • 场景 > SLO 图表:新增故障时间显示。
  • 部署版:管理后台映射规则新增仅针对新加入成员应用适配规则,用户启用选择该选项时,映射规则适配仅针对首次加入成员生效。

2023 年 8 月 24 日

观测云更新

  • 计费项
    • 备份日志:新增 OSS、OBS、AWS S3、Kafka 四种存档类型计费项,基于用户选择的对应存档类型统计汇总转发的流量大小,并根据数据对应出账;
    • 应用性能 Trace、用户访问 PV 新增 30天/60天的数据存储策略。
  • 监控:
    • 静默规则:支持基于不同维度配置告警沉默。
    • 监控器:支持为监控器添加标签,根据标签过滤列表;监控器列表增加快捷筛选列,并对列表进行了一些优化;
    • SLO:新增故障时间显示列。
  • 日志 > 备份日志:新增 Kafka 消息队列外部存储。
  • 查看器/仪表板:新增自动刷新功能
  • 查看器详情页:新增绑定内置视图入口。

集成更新

  • 阿里云 RDS MariaDB:阿里云 RDS MariaDB 的展示指标包括响应时间、并发连接数、QPS 和 TPS 等。
  • 阿里云 RocketMQ4:阿里云 RocketMQ 4.0 的展示指标包括消息吞吐量、延迟、可靠性和水平扩展能力等。
  • 阿里云 Tair 社区版:阿里云 Tair 社区版指标展示包括 CPU 使用率、内存使用率、代理总QPS、网络流量、命中率等。
  • AWS DynamoDB:AWS DynamoDB 的展示指标包括吞吐量容量单位(Capacity Units)、延迟、并发连接数和读写吞吐量,这些指标反映了 DynamoDB 在处理大规模数据存储和访问时的性能表现和可扩展性。
  • AWS EventBridge:AWS EventBridge 的展示指标包括事件传递延迟、吞吐量、事件规模和可伸缩性,这些指标反映了 EventBridge 在处理大规模事件流和实时数据传递时的性能表现和可靠性。
  • AWS Lambda:AWS Lambda 的展示指标包括冷启动时间、执行时间、并发执行数和内存使用量,这些指标反映了 Lambda 函数的响应速度、可扩展性和资源利用情况。
  • HUAWEI SYS.AS:HUAWEI SYS.AS 的展示指标包括响应时间、并发连接数、吞吐量和可靠性,这些指标反映了 SYS.AS 在处理应用程序请求和数据交互时的性能表现和稳定性。
  • HUAWEI SYS.CBR:HUAWEI SYS.CBR 的展示指标包括带宽利用率、延迟、丢包率和网络吞吐量,这些指标反映了CBR在网络传输和带宽管理方面的性能表现和质量保证。
  • 华为云 GaussDB-Cassandra:华为云 GaussDB-Cassandra 的展示指标包括读写吞吐量、延迟、数据一致性和可扩展性,这些指标反映了 GaussDB-Cassandra 在处理大规模分布式数据存储和访问时的性能表现和可靠性。
  • 华为云 GaussDB for MySQL:华为云 GaussDB for MySQL 的展示指标包括响应时间、并发连接数、读写吞吐量和可扩展性,这些指标反映了 GaussDB for MySQL 在处理大规模关系型数据库操作时的性能表现和可靠性。
  • 华为云 GaussDB-Influx:华为云 GaussDB-Influx 的展示指标包括写入吞吐量、查询延迟、数据保留策略和可扩展性,这些指标反映了 GaussDB-Influx 在处理大规模时序数据存储和查询时的性能表现和可靠性。
  • 华为云 GaussDB-Redis:华为云 GaussDB-Redis 的展示指标包括读写吞吐量、响应时间、并发连接数和数据持久性,这些指标反映了 GaussDB-Redis 在处理高并发数据存储和缓存时的性能表现和可靠性。
  • 华为云 GaussDB SYS.GAUSSDBV5:华为云 GaussDB SYS.GAUSSDBV5,提供 CPU、内存、磁盘、死锁、SQL 响应时间指标等数据。
  • 华为云 MongoDB:华为云 MongoDB 的展示指标包括读写吞吐量、延迟、并发连接数和数据可靠性,这些指标反映了 MongoDB 在处理大规模文档存储和查询时的性能表现和可扩展性。
  • 华为云 RDS PostgreSQL:华为云 RDS PostgreSQL 的展示指标包括查询性能、事务吞吐量、并发连接数和数据可靠性,这些指标反映了 RDS PostgreSQL 在处理大规模关系型数据存储和事务处理时的性能表现和可靠性。
  • 腾讯云 CKafka:腾讯云 CKafka 的展示指标包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 CKafka 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
  • Zadigx:Zadigx 展示包括概览、自动化构建、自动化部署、自动化测试等。
  • 飞书与异常追踪联动:为方便更加及时可方便的获取异常追踪中的新 Issue,可以通过在内部群中创建一个飞书、钉钉或者企业微信的机器人来接受异常追踪中的新 Issue 或新回复的提醒,帮助及时处理 Issue;也可以通过 @机器人的这种方式来快速进行 Issue 回复,提高我们的异常处理效率。

2023 年 8 月 17 日

观测云更新

  • 管理:新增敏感数据扫描功能:通过为数据创建脱敏规则的方式,实现信息屏蔽。
  • 新增计费项:敏感数据扫描流量:基于扫描规则统计扫描到的敏感数据原始流量大小(每 GB / 天)。
  • 付费计划与账单:消费分析板块因作改造优化处理,暂时下架。

2023 年 8 月 10 日

观测云更新

  • 新增计费项:
    • 定时报告:按工作空间内定时报告单日发送的次数出账计费;
  • 场景:
    • 新增 *服务管理*:服务管理是一个用于访问所有服务关键信息的集中入口,用户可查看当前工作空间内不同服务的性能和业务数据及所有的关联分析等信息,快速定位并解决服务的相关问题。
    • 图表均支持 PromQL 查询和表达式查询。
  • 日志:支持在日志详情页直接查看上下文日志;可选择上下文检索范围。
  • 查看器:打开某条数据详情页,支持一键导出当前数据为 JSON 文件。
  • 应用性能监测 > 服务 > 调用拓扑:新增当前服务的上下游调用关系表格,展示服务单向关系的请求数、平均响应时间和错误数。
  • 监控器 > 阈值检测:检测指标新增转换为 PromQL 查询
  • 基础设施 > 容器:Pods、Services、Deployments、Nodes、Replica Sets、Cron Jobs、Daemonset 详情页新增 Kubernets 事件组件。

2023 年 7 月 27 日

观测云更新

  • 场景 > 仪表板:新增定时报告功能,支持用户创建基于某仪表板的报告,并可以配置定时邮件发送。
  • 导航栏新增 *邀请成员* 入口,可通过该入口快速邀请成员。在管理页面,新增邀请审批按钮。该按钮开启情况下,向成员发送邀请后,须移至邀请记录审批管理成员加入申请。
  • 日志 > 备份日志有以下调整:
    • 观测云默认存档类型下线:
      • 新创建的备份规则中将不再支持【观测云】默认选项;
      • 历史已创建的备份规则依然生效。
    • 新增支持备份到外部存储阿里云 OSS
  • 监控 > 新建:支持将监控器保存为自定义模板库,以便后续用户快速创建同类型监控器检测。
  • 监控 > 新建监控器 > 自定义新建:除【突变检测】【区间检测】【离群检测】以外,所有检测规则的检测频率新增【最近 12 小时】【最新 24 小时】选项。
  • *异常追踪:新建 Issue 页面新增投递频道配置入口,支持多选;等级新增未知*选项,默认选中该选项。
  • 为满足用户数据合规性要求,快照支持针对字段通过正则语法对某些内容脱敏。
  • 场景 >日志流图新增 Copy as cURL、导出为 CSV 文件功能。
  • 用户访问监测 > 查看器 > Error:新增 *聚类分析* 功能,方便查看发生频次较高的错误。
  • 新增数据上限提示:即日志、链路等数据量到达今日上限,将停止数据接收,如需调整,请联系客户经理。

2023 年 7 月 11 日

观测云更新

  • 集成升级:点击任意集成方案,即可在同一页面上了解从配置接入、数据采集到数据应用的全链路使用方案。
  • *监控器 > 模板* 功能优化:支持基于单个检测规则创建或批量创建;支持基于检测库进行筛选。
  • 应用性能监测 > 链路Span 列表页面新增瀑布图模式,帮助用户以更直观的视角分析 Span 数据信息;*服务调用关系* 从服务(service)变更为服务资源(service / resource)级别,通过下钻到接口级别来更好地分析对应的性能及调用问题,从而通过接口级别的调用帮助用户更快发现问题点。
  • *图表 > 概览图:新增千位分隔符;单位 > 数值中,“默认”改为“万进制”;值映射*中新增空值映射。
  • *图表 > 矩形树图*:新增显示值选项,选中可在图中直接显示查询结果值。
  • *图表 > 添加链接*:新增 query 参数,删除 tagssearch 两个参数。
  • 应用性能监测 > 服务列表支持导出。

智能巡检更新

功能优化:

  • 应用性能巡检:新增默认检测阈值更改入口,现在在开启巡检时可以同步需改需要检测服务的触发值。
  • RUM 性能巡检:对页面详情模块中根因展示逻辑进行优化,优化后,根因定位更加准确。
  • 工作空间资产巡检:新增默认配置(7 天),现在开启巡检不需要参数也可以运行。

新增脚本:

  • 云消息队列 RocketMQ4.0
  • 华为云-CSS
  • 华为云-RocketMQ
  • 华为云-RabbitMQ
  • 华为云-WAF-事件列表
  • 华为云-WAF-事件概览

2023 年 6 月 29 日

观测云更新

本次更新简化了注册流程:

  • 国际站观测云产品服务正式上线,用户可前往 AWS 海外云市场购买。
  • 国际站观测云产品采用以美元为单位的计价体系。中国站原俄勒冈站点注册的工作空间数据将按照调整后的价格计费。

  • 观测云企业账号这一概念正式更改为费用中心账号

其他更新:

  • 快照权限:只读成员支持创建和删除仅自己可见的快照。

2023 年 6 月 20 日

观测云更新

  • RUM (Real User Monitoring) 采集器用于收集网页端或移动端上报的用户访问监测数据。现提供 RUM Headless一键开通服务,实现自动化安装部署在观测云的云主机中,自动完成 DataKit 安装,RUM 采集器部署。只需要手动接入应用即可。
  • 查看器优化筛选、搜索的交互转化等逻辑,让用户真正做到所见即所得,且能够在 UI 和手写模式自由切换。另:日志查看器支持的 DQL 手写模式新版本上线后将会做下线处理。
  • 日志 > 备份日志:新增外部存储类型选择,支持写入 S3(AWS) 对象存储、支持华为云 OBS 数据写入
  • 日志 > 索引:新增日志易数据绑定配置入口
  • 仪表板/内置视图支持根因分析和下钻分析
  • 管理 > 角色管理:支持克隆已有用户角色减少操作步骤,快速增减权限并创建角色。
  • 基础设施 > 容器:新增 Daemonset 对象数据显示,可拖拽改变对象分类显示顺序。
  • 基础设施 > 容器:Deployments、Pods 支持直接关联 kubernetes 事件日志,在详情页可直接查看具体日志信息。
  • 新增异常追踪 OpenAPI 接口
  • 管理 > 成员管理列表、监控 > 通知对象管理 > 邮件组异常追踪 > 查看成员、所有选择通知对象处均支持按成员昵称进行检索。
  • 工单状态更新或有新回复时,通过界面或者邮件提醒客户关注。
  • 文本输入框输入不合法的字符或长度限制提示优化。

智能巡检更新

  • 新增巡检

    • AWS Cloudtrail 异常事件巡检:AWS CloudTrail 是一项用于跟踪、日志记录和监控AWS账户活动的服务。它记录了 AWS 账户中进行的操作,包括管理控制台访问、API 调用、资源变更等,我们可以通过监控 CloudTrail 的错误事件,及时发现潜在的安全问题。例如,非授权的 API 调用、访问被拒绝的资源、异常的身份验证尝试等。这有助于保护您的 AWS 账户和资源免受未经授权的访问和恶意活动;还可以了解到系统中发生的故障类型、频率和影响范围。这有助于您快速识别问题并采取适当的纠正措施,以减少服务中断时间和业务影响。
  • 新增脚本

    • 观测云集成(阿里云-RDS错误日志):收集阿里云的 RDS 错误日志,用于 RDS 的错误信息诊断;
    • filebeats 数据采集器:收集 FileBeats 性能数据用于观测 FileBeats 性能、延迟等场景;
    • logstash 数据采集器:收集 Logstash 性能数据用于观测 Logstash 性能、延迟等场景。

2023 年 6 月 6 日

观测云更新

  • 为进一步满足用户数据查看需求,商业版付费计划与账单新增设置高消费预警功能,新增消费分析列表,支持查看各类支出消费统计。
  • 创建工作空间时新增菜单风格选择,支持选择不同的工作空间风格属性。
  • 优化日志数据访问权限相关规则适配,进一步明确多角色数据查询权限及权限控制对应关系。
  • 事件详情页下的基础属性下的检测维度新增关联查询,支持查看筛选当前检测维度下全部字段值的关联数据。
  • 告警策略管理支持不同级别告警到不同的通知对象
  • 成员管理新增添加昵称备注功能,规范工作空间内的成员用户名,支持通过昵称备注搜索成员。
  • 仪表板、查看器、监控、成员管理、分享管理等页面列表新增批量操作功能。
  • 应用性能监测服务支持修改颜色,支持表头排序调整
  • 日志、应用性能监测 > 错误追踪查看器聚类分析支持对文档数量排序,默认倒序。
  • 支持保存登录选择语言版本到浏览器本地,再次登录自动显示上一次登录选择语言版本。
  • 生成指标频率选项调整,支持选择 1 分钟、5 分钟、15 分钟。

观测云部署版更新

  • 管理后台新增密码安全策略:新增密码 8 位长度限制及密码有效期功能。

智能巡检更新

  • 新增巡检

    • 工作空间资产巡检:针对于服务巡检应当确保服务正常运行,及时发现故障或异常,降低业务损失。其次,巡检有助于提高服务可用性和稳定性,发现并解决潜在问题。还可以巡检提高运维效率,加速问题诊断和解决,优化资源配置。保障业务安全。通过对主机、K8s、容器等服务的定期巡检,运维人员可以确保这些服务能够高效、稳定地支持业务,为企业提供持续可靠的运行环境。
  • 新增脚本

    • Gitlab 研发效能分析:根据 Gitlab 的代码提交频率和每次代码量,分团队、个人、时间维度展示团队的研发效能。

2023 年 6 月 1 日

观测云更新

DataFlux Func 是观测云的扩展编程平台,可用于同步云平台数据、函数开发、管理和执行。现支持 DataFlux Func 托管版在国内所有站点一键开通服务,开通完成后即可在云主机中自动化部署 Func,在工作空间的集成可以快速登录对应 Func 平台。

2023 年 5 月 22 日

观测云更新

  • RUM 应用配置新增自定义类型和关联视图查看分析
  • DQL 函数支持正则聚合数据统计显示返回,新增字符串正则表达式解析函数,根据正则表达式提取字段、判断字段中是否有符合正则的子串
  • 新增 PromQL 语法查询入口,支持通过 PromQL 查询时序数据
  • show_tag_value() 函数支持查询对应指标字段的关联标签
  • 小程序 SDK 支持采集启动参数相关的信息;新增自定义添加 Error
  • Status Page 支持订阅故障通知
  • 新增字段管理功能,在监控器、图表查询、查看器等位置若选择了相关字段则显示对应的描述和单位信息
  • 指标分析新增表格功能,支持下载
  • 工单状态调整
  • 新增异常追踪引导页,频道新增时间范围筛选
  • 备份日志优化:
    • 新增备份规则入口移至备份日志 > 备份管理;
    • 新增全部备份逻辑:不添加筛选即表示保存全部日志数据

观测云部署版更新

  • 管理后台新增审计事件记录

智能巡检更新

  • 新增巡检

    • 云上闲置资源巡检:云计算作为一种全新的IT服务方式发展迅猛,为企业和个人提供了方便、快捷、弹性的IT基础设施和应用服务,并带来极高的效率和经济性。然而,随着云资源逐渐成为企业数据中心的主要组成部分之后,云上资源的巨大浪费问题也愈加显著。尤其是在企业范围内,因为需求波动和部门之间的隔离等原因,导致部分云上资源无法得到充分利用,形成了大量的闲置资源。这种情况会使企业的云服务成本直线上升、资源效率下降,还有可能降低安全和性能水平。为了更好地管理和优化云上闲置资源,以提升云计算的使用效益和资源利用率,进行云上闲置资源巡检是非常有必要的。通过巡检,可以发现当前云服务中的不必要资源,及时进行处理,避免长时间不必要的资源使用而带来的费用开销、数据泄露、性能不佳等问题。

    • 主机重启巡检:主机异常重启监控是现代互联网系统运维中的一个重要环节。一方面,计算机系统的稳定性和可靠性对于业务的平稳运行和用户的体验至关重要。当主机发生异常重启等问题时,会导致系统崩溃、服务中断和数据丢失等风险,进而影响业务运营和用户满意度。另一方面,在云计算和虚拟化环境中,主机的数量和规模不断增多,系统复杂度也在不断提高,出现问题的概率也在不断增加,这就需要系统管理员使用相关的系统监控工具进行实时监控,并及时发现解决异常重启等问题。因此,合理地实现主机异常重启监控,能够帮助企业快速诊断问题、降低业务风险、提升运维效率和用户体验。

  • 功能优化

    • 闲置主机巡检:新增对云主机类型关联添加费用相关信息。

更多智能巡检更新可参考 智能巡检版本历史

2023 年 4 月 27 日

观测云更新

  • 概览图支持同时展示多个同期对比维度(日同比/周同比/月同比/...)
  • 标准成员新增快照分享功能
  • DQL 查询更名为查询工具,新增执行按钮
  • 主机列表显示优化,处于告警沉默的主机新增静默提示
  • SLO 告警通知内容优化,新增工作空间和站点的信息
  • 优化工作空间 ID 和 Token 的显示逻辑,默认隐藏,支持查看和复制
  • 体验版工作空间新增 Session Replay、Profile 的使用限制

2023 年 4 月 23 日

观测云计费更新:

  • 观测云自研时序数据库 GuanceDB 全新上线,时序数据存储及计费将会做如下调整:

    • 基础设施(DataKit)计费项下线,原 “DataKit + 时间线”、“仅时间线” 两种计费模式按照仅 GuanceDB 时间线作为出账逻辑使用;
    • GuanceDB 时间线:统计当天活跃的时间线数量计费,单价低至 ¥0.6 / 每千条时间线。
  • 用户访问监测 “会话重放” 正式启动付费,按照实际采集会话重放数据的 session 数量计费,¥10 / 每千个 Session。

更多详情可参考文档计费方式

观测云功能更新:

  • GuanceDB 时序数据库全新上线
  • 异常追踪 新功能上线
  • 跨站点工作空间授权 功能上线
  • SLS 新增第三方授权开通
  • 绑定索引配置页面优化,支持自定义添加映射字段配置
  • 图表优化
    • 命令面板 新增本地 Func 的自定义函数选择
    • 时序图新增 高级函数,支持本地 Func 根据 DQL 查询结果二次处理后返回显示
  • 工作空间新增时区配置,用户可自定义配置当前工作空间查询时间的时区
  • 集成 > DataKit 页面引导优化
  • 查看器柱状分布图新增统计时间区间显示
  • 导航菜单支持右键选择新页打开
  • 黑名单重名导入问题修复

观测云部署版更新

  • 新增账号登录映射规则配置,根据不同的映射规则动态分配成员加入的工作空间及对应的角色。

DataKit 更新

新加功能:

  • 新增 Pinpoint API 接入

功能优化:

  • 优化 Windows 安装脚本和升级脚本输出方式,便于在终端直接黏贴复制
  • 优化 Datakit 自身文档构建流程
  • 优化 OpenTelemetry 字段处理
  • Prom 采集器支持采集 info 类型的 label 并将其追加到所有关联指标上(默认开启)
  • system 采集器中,新增 CPU 和内存占用百分比指标
  • Datakit 在发送的数据中,增加数据点数标记(X-Points),便于中心相关指标构建
    • 另外优化了 Datakit HTTP 的 User-Agent 标记,改为 datakit-<os>-<arch>/<version> 这种形态
  • KafkaMQ
    • 支持处理 Jaeger 数据
    • 优化 SkyWalking 数据的处理流程
    • 新增第三方 RUM 接入功能
  • SkyWalking 新增 HTTP 接入功能
  • 增加如下集成测试:
    • Apache
    • JVM
    • Memcached
    • MongoDB
    • RabbitMQ
    • Statsd
    • Tomcat
    • etcd

更多 DataKit 更新可参考 DataKit 版本历史

2023 年 4 月 13 日

智能巡检更新

  • 脚本市场智能巡检脚本集:

    • 优化开启步骤,无须新创建脚本,无须新建调度,从官方脚本市场点击安装后,自动完成创建与调度,配置参数后即可开启;
    • 更新磁盘使用率巡检:对磁盘使用率巡检趋势判断算法优化,为用户提供更精准的问题定位。
  • 脚本市场云同步脚本集:

    • 优化开启步骤,无须新创建脚本,无须新建调度,从官方脚本市场点击安装后,自动完成创建与调度,配置参数后即可开启;
    • 新增 AWS 同步多种认证方式;
    • 新增 AWS Cloudwatch Logs 同步。

更多智能巡检更新可参考 智能巡检版本历史

2023 年 4 月 11 日

观测云更新

新增华为云云商店开通流程

  • 观测云新增华为云云商店一键开通观测云的流程,在华为云云商店订阅观测云商品后,可直接开通使用观测云。更多详情可参考文档华为云云商店开通观测云商业版

2023 年 4 月 6 号

观测云更新

  • 日志新增 3 天数据保存策略和定价,计费相关请参考文档 计费方式
  • 日志新增 数据访问 权限控制,支持将某个范围内的日志数据查看权限授予给相关角色
  • 角色权限清单 新增各功能模块数据查询权限,支持自定义角色配置对应模块的数据查询权限入口
  • 标准成员新增 “快照管理” 权限,支持快照增删操作
  • 快照分享 支持搜索功能。(日志 DQL 查询模式下不支持调整搜索范围)
  • 支持本地 Func 通过 websocket 协议创建 自定义的通知对象,实现外部通知渠道接收告警通知
  • 查看器新增 copy as cURL 数据查询功能
  • 仪表板图表配置交互优化
    • 概览图 新增数值单位选项配置,支持选择中国科学记数法进位(default)和短级差制(short scale)
    • 新增 视图变量 是否应用到图表效果显示
    • 图表存在分组条件时,支持将某个分组条件值反向应用到视图变量实现联动筛选
    • 图表存在分组条件时,选中某个分组条件对应时间线或数据点时支持其他图表中相同分组联动高亮显示
    • 图表拖拽效果优化
  • 账号无操作会话过期时间 默认调整为 3 小时,此次调整仅针对未编辑过无操作会话过期时间配置的账号,不影响已编辑过的无操作会话过期时间配置的账号。
  • 筛选历史 新增搜索条件保存
  • 用户访问监测 应用 SDK 接入 引导优化
  • 生成指标 配置优化,支持针对新生成的指标配置单位和描述
  • 主机查看器 支持多行显示,多行模式下 label 将另起一行显示
  • 时序图饼图新增返回显示数量配置

DataKit 更新

新加功能

  • 新增伺服服务,用来管理 Datakit 升级
  • 新增故障排查功能

功能优化

  • 优化升级功能,避免 datakit.conf 文件被破坏
  • 优化 cgroup 配置,移除 CPU 最小值限制
  • 优化 self 采集器,我们能选择是否开启该采集器,同时对其采集性能做了一些优化
  • Prom 采集器允许增加 instance tag,以保持跟原生 Prometheus 体系一致
  • DCA 增加 Kubernetes 部署方式
  • 优化日志采集的磁盘缓存性能
  • 优化 Datakit 自身指标体系,暴露更多 Prometheus 指标
  • 优化 /v1/write
  • 优化安装过程中 token 出错提示
  • monitor 支持自动从 datakit.conf 中获取连接地址
  • 取消 eBPF 对内核版本的强制检查,尽量支持更多的内核版本
  • Kafka 订阅采集支持多行 json 功能
  • 优化 IO 模块的配置,新增上传 worker 数配置字段

兼容调整

  • 本次移除了大部分 Sinker 功能,只保留了 Dataway 上的 Sinker 功能。同时 sinker 的主机安装配置以及 Kubernetes 安装配置都做了调整,其中的配置方式也跟之前不同,请大家升级的时候,注意调整
  • 老版本的发送失败磁盘缓存由于性能问题,我们替换了实现方式。新的实现方式,其缓存的二进制格式不再兼容,如果升级的话,老的数据将不被识别。建议先手动删除老的缓存数据(老数据可能会影响新版本磁盘缓存),然后再升级新版本的 Datakit。尽管如此,新版本的磁盘缓存,仍然是一个实验性功能,请谨慎使用
  • Datakit 自身指标体系做了更新,原有 DCA 获取到的指标将有一定的缺失,但不影响 DCA 本身功能的运行

更多 DataKit 更新可参考 DataKit 版本历史

2023 年 3 月 23 号

观测云更新

  • 帮助文档搜索功能优化

  • 备份日志 新增扩展字段保存逻辑,默认仅备份 message 内容到备份日志,若勾选“同步备份扩展字段”,将备份符合筛选条件的整条日志数据

  • 查看器/仪表板 时间控件 新增“时区选择”和“全局锁定”功能

  • 监控器优化

    • 支持查看上次的历史配置,支持点击还原到 历史配置版本
    • 列表和页面新增创建、变更信息显示
    • 突变检测 新增对比维度,支持选择跟“昨日”“上一小时”统计指标比对逻辑
  • 智能巡检 事件新增效果反馈入口

  • 快照 分享支持添加“创建人”水印显示
  • 注册开通流程优化,云市场开通路径新增站点选择
  • 笔记 创建逻辑和添加内容交互调整
  • 图表查询 新增 label 反选逻辑
  • 链路 详情页 Span 列表显示逻辑调整,按“持续时间”倒序显示
  • 成员管理 触发审核流程后角色修改逻辑调整
  • 查看器列宽度保存、日志显示多行等逻辑调整

2023 年 3 月 9 号

观测云更新

数据存储策略变更优化

取消数据存储策略每天只能修改 1 次的逻辑,支持用户当天内多次调整数据存储策略。

注意:数据存储策略除当天内第一次修改会立即生效,其他的修改操作将按照最后一次调整记录次日生效。关于如何变更,可参考文档 数据存储策略

图表链接配置优化

图表链接配置交互升级,在文本框输入基础上,支持通过参数配置自由组合生成最终图表关联链接 URL。更多详情可参考文档 自定义链接

新增支持创建重名的仪表板、笔记、自定义查看器

优化仪表板、笔记、自定义查看器导入功能,若发现文件重名时支持自定义选择「跳过」、「仍然创建」、「取消」等操作。涉及导入模块:

  • 场景:仪表板、笔记、查看器
  • 管理:设置 - 配置迁移

注意:若选择「取消」导入后,当次选中的文件均不会做导入操作。更多详情可参考文档 配置迁移

DQL 参数生效优先级调整

若您使用手写 DQL 模式查询数据时,DQL 中的时间参数配置将会优先于时间控件的输入范围。涉及功能:

  • 仪表板:视图变量默认值查询、图表查询
  • 指标分析
  • DQL 查询工具

日志 Message 数据展示优化

日志查看列表支持选择显示全部 message 内容。涉及功能:

  • 日志查看器
  • 各查看器详情页关联日志页面

监控配置页面优化

在配置监控器事件通知时:

  • 支持自定义「数据断档」事件通知模板
  • 事件内容支持添加跳转链接,除官方提供的默认链接,您还可以自定义跳转链接

更多详情可参考文档 监控器配置

SSO 相关优化

  • SSO 用户支持修改账户信息和会话保持时间等策略
  • SAML 账号映射规则配置优化,兼容 “Email” 多种大小写格式
  • 单点登录链接获取逻辑优化,针对已经加入过工作空间的 SSO 用户优先列出已加入的工作空间登录链接

其他功能优化

  • 商业版开通流程支持 “观测云直接开通”、“阿里云市场开通“和“亚马逊云市场开通“三种方式任意选择;
  • 查看器左 * 查询功能范围调整,新开通的工作空间不再默认支持左 * 查询,如有需求请联系客户经理;
  • SLIMIT 限制调整,时序图查询若存在 group by 分组时,默认返回最多 20 条数据;
  • 新创建的工作空间新手引导流程优化。

DataKit 更新

新加功能

  • Pipeline 支持 key 删除
  • Pipeline 增加新的 KV 操作
  • Pipeline 增加时间函数
  • netstat 支持 IPV6
  • diskio 支持 io wait 指标
  • 容器采集允许 Docker 和 Containerd 共存
  • 整合 Datakit Operator 配置文档

功能优化

  • 优化 Point Checker
  • 优化 Pipeline replace 性能
  • 优化 Windows 下 Datakit 安装流程
  • 优化 confd 配置处理流程
  • 添加 Filebeat 集成测试能力
  • 添加 Nginx 集成测试能力
  • 重构 OTEL Agent
  • 重构 Datakit Monitor 信息

更多 DataKit 更新可参考 DataKit 版本历史

2023 年 2 月 28 号

观测云更新

新增会话重放功能

会话重放是用户体验网站的重建演示,通过捕获单击、鼠标移动和页面滚动等内容,生成视频记录,深入了解用户的操作体验。更多详情可参考文档 会话重放

优化 AWS 开通流程

观测云优化 AWS 云市场一键开通观测云的流程,在 AWS 云市场订阅观测云商品后,可直接开通使用观测云。更多详情可参考文档 在 AWS 开通观测云

2023 年 2 月 23 号

观测云更新

用户访问监测优化

新增用户访问监测自动化追踪

用户访问监测新增自动化追踪,通过“浏览器插件”的实现方式,使用浏览器记录用户访问行为,创建无代码的端到端测试。更多详情可参考文档 自动化追踪

用户访问监测应用列表、查看器、分析看板布局整体调整
  • 用户访问监测应用列表显示布局调整,支持在应用列表跳转查看当前应用的“分析看板”和“查看器”内容详情。

  • 用户访问监测“查看器”支持查看所有应用的用户访问数据,您可以通过筛选 “应用ID” 来查看和分析不同应用的数据。

  • 用户访问监测“分析看板“支持切换查看 Web 端、移动端、小程序的场景分析视图。

新增 CDN 质量分析

用户访问监测新增 CDN 厂商信息采集,通过分析图表对不同厂商的 CDN 进行质量分析。更多配置可参考 用户访问监测采集器配置

新增 UniAPP 应用接入

用户访问监测新增 UniAPP 应用接入,当前版本支持 Android 和 iOS 平台。更多详情可参考 UniApp 应用接入

场景优化

新增自定义查看器导航菜单

在场景查看器列表,新增支持将当前查看器添加至基础设施、指标、日志、应用性能监测、用户访问监测、可用性监测、安全巡检、CI 可视化导航菜单。更多详情可参考 添加查看器导航菜单

增强场景视图变量级联功能

在场景视图变量配置级联查询时,支持使用 =!= 精确匹配变量值,支持使用 match(re)not match(re)wildcardnot wildcard 模糊匹配变量值。更多详情可参考文档 视图变量

饼图新增合并配置选项

饼图新增合并配置选项,支持用户将冗余的数据点合并到 “其他” 显示,提高饼图的可读性。更多详情可参考文档 饼图

调整图表查询运算符翻译逻辑

图表查询中 match / not match 运算符翻译逻辑调整,日志类数据中 match 去除默认添加右 * 匹配逻辑,若有需求可手动在输入框中添加。

其他功能优化

  • 观测云 商业版注册 流程支持绑定观测云费用中心账号;
  • 配置 监控器 时,「检测维度」支持非必选。

DataKit 更新

新加功能

  • 命令行增加解析行协议功能
  • Datakit yaml 和 helm 支持资源 limit 配置
  • Datakit yaml 和 helm 支持 CRD 部署
  • 添加 SQL-Server 集成测试
  • RUM 支持 resource CDN 标注

功能优化

  • 优化拨测逻辑
  • 优化 Windows 下安装提示
  • 优化 powershell 安装脚本模板
  • 优化 k8s 中 Pod, ReplicaSet, Deployment 的关联方法
  • 重构 point 数据结构及功能
  • Datakit 自带 eBPF 采集器二进制安装

更多 DataKit 更新可参考 DataKit 版本历史

2023 年 2 月 16 号

观测云更新

优化工作空间权限管理

新增成员角色及权限清单管理

观测云新增角色管理功能,支持对企业中的员工设置不同的观测云功能访问权限,以达到不同员工之间的权限隔离。

观测云默认提供四种成员角色,分别为“Owner”、“Administrator”、“Standard”和“Read-only”,除了默认角色以外,观测云支持在角色管理创建新的角色,并为角色赋予权限范围,满足不同用户的权限需要。更多详情可参考文档 角色管理

优化成员邀请,增加选择成员权限

在当前空间内,邀请的新成员,默认权限为只读成员,新增支持选择一个或多个角色来设置新成员的权限,更多详情可参考文档 成员管理

新增批量修改成员权限

在成员管理,新增批量修改权限功能,点击「批量修改权限」,选择需要批量修改权限的成员,点击「确定」,在弹出的对话框中为成员选择权限后「确定」即可。更多详情可参考文档 成员管理

优化 SSO 管理,新增 SAML 映射功能

观测云新增基于配置 SAML 映射关系,为企业提供更精细的单点登录方案,开启 SAML 映射后,支持为企业员工动态的分配访问权限,员工可根据被分配的角色权限来访问观测云。

在观测云工作空间「管理」-「成员管理」-「SSO管理」-「SSO 登录」,启用 「SAML 映射」,并在「SAML 映射」配置映射关系。更多详情可参考文档 SSO管理

成员管理页面显示优化

在成员管理,新增自定义角色管理功能,调整搜索、快捷筛选等布局。更多详情可参考文档 成员管理

权限变更审核优化

基于新增的角色权限管理,调整费用中心审核的触发条件,当用户角色被赋予 Token 的查看、操作权限,即触发观测云费用中心的审核。更多详情可参考文档 权限变更审核

新增登录会话保持时间设置

观测云支持为登录到工作空间的账号设置会话保持时间,包括 SSO 单点登录的账号和工作空间注册的账号,支持为登录账号设置“无操作登录会话保持时间”和“登录会话最大保持时间”,设置以后,超时登录会话会失效。

  • 无操作登录会话保持时间:支持设置范围 30 ~ 1440 分钟,默认为 30 分钟;
  • 登录会话最大保持时间:支持设置范围 0 ~ 7 天,其中 0 表示永不超时,默认为 7 天。

新增工单管理

针对在观测云中遇到的问题,用户可以通过提交工单的方式进行咨询与建议,官方会进行及时的处理与反馈。例如:使用过程中遇到难以解决的问题、购买以及费用相关的咨询、向观测云提出需求建议等等。

工单系统是基于个人账号级别的,用户可以在工单管理中查看由本人提交的所有工单,不区分工作空间。工单管理入口:左下角「账号」-「工单管理」。更多详情可参考文档 工单管理

其他功能优化

  • 工作空间创建时新增语言选择,语言选项影响工作空间内事件、告警、短信等模板,若选择英文,上述对应模板将默认使用英文模板;
  • 优化工作空间锁定功能,若费用中心账号欠费或云市场订阅异常等情况会导致工作空间锁定,工作空间锁定以后,新数据将停止上报,观测云提供 14 天的缓冲期,您可以在这期间继续查看和分析历史数据,并通过解除锁定状态,继续使用观测云。更多详情可参考文档 工作空间锁定

智能巡检更新

  • RUM 性能巡检:支持影响用户的会话 ID 跳转查看问题 Session,在巡检事件报告中提供更专业的优化手段。
  • 云账户实例维度账单巡检:新增对 AWS 账户实例维度账单巡检支持。

更多智能巡检更新可参考 智能巡检更新日志

最佳实践更新

  • 云平台接入
    • 阿里云 - 阿里云事件总线 EventBridge 最佳实践

更多最佳实践更新可参考 最佳实践版本历史

2023 年 2 月 9 号

DataKit 更新

新加功能

  • Datakit 主机安装可自定义默认采集器开启
  • 提供 OTEL 的错误追踪
  • 提供 RUM Session 回放能力

功能优化

  • Datakit pyroscope profiling 多程序语言识别
  • 优化 CPU, Disk, EBPF, Net 等中英文文档
  • 优化 elasticsearch, postgresql, dialtesting 等英文文档
  • 优化 DCA, Profiling 文档
  • 优化日志采集流程
  • iploc yaml 配置方法文档支持

更多 DataKit 更新可参考 DataKit 版本历史

智能巡检更新

新增巡检

  • RUM 性能巡检:Real User Monitoring(RUM)是一种应用性能监测技术,旨在通过模拟真实用户在浏览网站时的行为来评估网站性能。RUM 的目的是从用户的角度了解网站性能,了解网站加载时间,网页呈现的效果,页面元素的加载情况以及交互的反应。RUM 性能巡检的使用场景主要是对于客户端类型的网站,例如:电子商务网站、金融网站、娱乐网站等等,这些网站都需要向用户呈现一个快速和流畅的访问体验。通过对 RUM 性能结果分析,可以快速帮助开发人员可以了解用户的实际体验,以便快速改进网站的性能。
  • Kubernetes 健康巡检:现如今 Kubernetes 已经席卷了整个容器生态系统,它充当着容器分布式部署的大脑,旨在使用跨主机集群分布的容器来管理面向服务的应用程序。Kubernetes 提供了用于应用程序部署、调度、更新、服务发现和扩展的机制,但是该如何来保障 Kubernetes 节点的健康呢,通过智能巡检可以根据当前节点的资源状态、应用性能管理、服务故障日志等信息的检索和问题发现,从而加快事件调查、减轻工程师的压力、减少平均修复时间并改善最终用户体验。

更多智能巡检更新可参考 智能巡检更新日志

2023 年 1 月 17 号

观测云英文版上线

2023 年 1 月 12 号

观测云更新

新增观测云站点服务 Status Page

观测云提供 Status Page,帮助您实时查看观测云不同站点的服务状态。若您已经登录到观测云,您可以通过点击左下角的帮助 > Status Page来查看观测云各个站点的服务状态。更多详情可参考文档 Status Page

新增绑定自建 Elasticsearch / OpenSearch 索引

观测云新增支持绑定自建 Elasticsearch / OpenSearch 索引,帮助您统一快速查看和分析您的日志数据。更多详情可参考文档 绑定索引

新增网络查看器列表模式

在「基础设施」-「网络」,选择「主机 / Pod / Deployment / Service」,支持切换至对应网络列表查看源 IP/端口和目标 IP/端口之间的 TCP 重传次数、TCP 连接数、TCP 关闭次数、TCP 延时、发送字节数、接收字节数、状态码等。更多详情可参考文档 网络

新增前端应用 Span 请求耗时分布显示

在链路详情页,若当前的链路属于前端应用调用产生的 Span,您可以在链路详情查看请求耗时分布,包括 Queueing(队列)、First Byte(首包)、Download(下载)的请求耗时占比,帮助您直观的查看前端某个 Span 的过程消耗占比。

注意:用户访问监测 SDK 必须是 2.2.10 以及上才可以看到这部分数据显示,如存在跨域情况需要调整 header 配置,更多详情可参考文档 Web 应用接入

优化用户访问监测 Session 交互逻辑

  • Session 查看器去掉所有记录列表;
  • Session 会话详情页显示优化:类型显示优化、支持切换会话发生的绝对时间、增加服务列、详情页显示优化、错误信息优化
  • Session 会话更新逻辑优化:Session 数据更新从追加的逻辑调整为基于 session_id 覆盖的逻辑
  • 链路中若存在前端应用调用产生的 Span,该 Span 对应的 service 值会根据当前用户访问数据中的 service 值做填充,若用户访问数据中不存在 service 的信息,则默认填充 "browser"

更多详情可参考文档 Session(会话)

Pod 指标数据采集默认关闭

在最新的 DataKit 版本中,container 采集器的 Pod 指标数据配置调整为默认关闭 enable_pod_metric = false 。更多详情可参考文档 容器数据采集

其他功能优化

  • 绑定 MFA 认证调整为邮箱验证
  • 注册时调整手机验证为邮箱验证
  • 登录时安全验证调整为滑块验证
  • 创建工作空间新增观测云专属版引导
  • 工作空间新增备注显示功能
  • 云账号结算用户新增在观测云付费计划与账单查看账单列表
  • 表格图支持基于 「by 分组」设置别名
  • 优化监控器配置中的时序图,仅在选择维度后显示
  • 优化日志类数据数据断档告警配置
  • OpenAPI 新增创建工作空间接口

DataKit 更新

  • confd 增加 Nacos 后端
  • 日志采集器添加 LocalCache 特性
  • 支持 C/C++ Profiling 数据
  • RUM Session Replay 文件上报
  • WEB DCA 支持远程更新 config

  • 优化 SQL 数据资源占用较高问题

  • 优化 Datakit Monitor

更多 DataKit 更新可参考 DataKit 版本历史

最佳实践更新

  • 云平台接入
    • AWS - EKS 部署 DataKit
  • 监控 Monitoring
    • 应用性能监控 (APM) - 调用链 - 使用 datakit-operator 注入 dd-java-agent

更多最佳实践更新可参考 最佳实践版本历史

文档评价

文档内容是否对您有帮助? ×