版本历史¶
1.77.150(2023 年 12 月 28 日)¶
pubrepo.guance.com/dataflux/1.77.150:launcher-e2e6b96-1704173035
私有部署版更新¶
- 针对自动化任务队列,实施优化策略:将所有 Func worker 的队列分散到不同的 Deployment 中,以提升系统的分布式处理能力和效率。
- 支持外部平台嵌套观测云页面,可使用 URL 里的参数设置隐藏左侧和头部菜单栏、支持隐藏悬浮操作;
- 支持外部平台通过 iframe 嵌套观测云仪表板或查看器页面。
观测云更新¶
- 监控:
- 新增用户访问智能检测:支持网站/ APP 的性能异常、错误分析,相关检测指标有 LCP、FID、CLS 等;
- 基础设施存活检测 V2:新增基础设施存活 V2 版本,优化检测逻辑,解决 V1 和进程检测相关的若干触发问题。
- 应用性能监测 (APM):
- 优化服务拓扑图:调整查看上下游、节点、服务名等展示样式;
- 优化服务详情:绑定性能视图仪表板展示当前服务性能指标,同样支持自定义同名用户视图覆盖更新,支持下钻分析;
- 优化链路详情火焰图、瀑布图展示:火焰图新增执行时间和执行占比显示;瀑布图支持相对时间和绝对时间切换展示。
- 图表优化:
- 时序表格图新增显示列配置:支持用户设置查询数据显示列,同时支持用户自定义手输列名;支持用户在编辑模式下手动调整列宽,保存后可根据列宽展示列表信息;支持拖拽调整显示列顺序;
- 图表链接新增值变量做链接跳转使用。
- 仪表板:
- 仪表板新增主页仪表板:支持工作空间配置主页仪表板;
- 基础设施:
- 主机查看器新增仅显示在线主机开关过滤:获取主机在线列表逻辑优化,支持选择是否仅列出最近 10 分钟有数据上报的主机列表。
DataKit 更新¶
- 新增功能
- 新增 OceanBase 自定义 SQL 采集
- 新增 Promremote 黑名单/白名单
- Kubernetes 资源数量采集添加 node_name tag(仅支持 Pod 资源)
- Kubernetes Pod 指标新增 cpu_limit_millicores/mem_limit/mem_used_percent_base_limit 字段
- eBPF 采集器新增 bpf-netlog 插件
- 问题修复
- 修复 external 采集器僵尸进程问题
- 修复容器日志 tags 冲突问题
- 数据 record 功能支持环境变量开启
- 修复虚拟网卡信息获取失败问题
- 修复 Pipeline Refer table 和 ipdb 功能失效问题
- 功能优化
- 优化 DDTrace 和 OTEL 字段提取白名单功能
- 优化 SQLServer 采集器的 sqlserver_lock_dead 指标获取 SQL
- 优化 PostgreSQL 采集器的连接库
- 优化 ElasticSearch 采集器的配置文件,设置 local 默认为 false
- K8s 安装时增加更多 ENV 配置项
- 优化 Datakit 自身指标暴露
- 更新部分采集器集成文档
集成更新¶
- 新增集成 Kubecost
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.76.149(2023 年 12 月 20 日)¶
pubrepo.guance.com/dataflux/1.76.149:launcher-c15108e-1703085794
私有部署版更新¶
- 后台管理平台英文语言支持
1.76.148(2023 年 12 月 19 日)¶
pubrepo.guance.com/dataflux/1.76.148:launcher-696a3e0-1702992814
此版本是 fix 版本,主要有如下更新:
观测云更新¶
- OpenApi 监控器告警策略相关接口更新
- 修复部署版使用 OpenSearch 引擎时,新接入数据工作空间偶发的 Query Faild 错误。
1.76.147(2023 年 12 月 14 日)¶
pubrepo.guance.com/dataflux/1.76.147:launcher-5616d5e-170882012
观测云部署版更新¶
- 管理后台调整:
- 新增告警通知独立发送配置:开启此配置后,告警策略选择【告警不聚合】选项时,每条事件都会发送一份告警通知,帮助您高效管理告警通知。
- 新增事件链接免登查看配置:开启此配置后,所有工作空间发送的告警通知内置的事件关联链接都可以免登访问。若关闭该配置,则历史发送的免登链接都会失效,保障数据安全。
- 优化【定时报告】:支持查询范围自定义配置,上限由 30 天调整为 360 天,满足您所需定时报告的拓展需求。
观测云更新¶
- 监控:
- 新增智能监控:
- 主机智能检测:支持 CPU 的突增/突降/区间上升,内存的突增/突降/区间上升检测;
- 日志智能检测:支持日志数量的突增/突降,错误日志的突增检测;
- 应用智能检测:支持请求数量突增/突降,错误请求数量突增,请求延迟的突增/突降/区间上升检测。
- 突变检测:新增触发规则前提条件,当检测值满足该条件时进行突变检测规则,提升监控精准度。
- 新增智能监控:
- 付费计划与账单:
- 新增数据转发使用分析列表:查看当前工作空间所有数据转发规则的转发数量。若转发规则是到观测云备份日志的模块,会显示对应的保存策略。同时,支持时间控件筛选所需的数据转发情况列表,方便快速查看历史日志的备份整体情况。
- 事件:
- 新增智能监控事件查看器:可查看智能监控产生的全部事件信息。
- 日志:
- 数据访问新增【仅显示跟我相关规则】配置:开启后仅显示影响当前账号数据查询的访问规则。
- 日志 > 查看器:新增数据访问规则限制提示。
- 基础设施 > 容器 > Kubernetes:
- 新增 Kubernetes 分析看板:容器对象分析看板,帮助您从不同维度了解 Kubernetes 中的各基础设施情况。
- 容器 > 查看器:页面 UI 优化。
- 指标:
- 指标 > 查看器:
- 表格图新增【查询工具】模式:返回结果与快捷入口 > 查询工具保持一致;若添加多个查询,默认返回第一条查询结果;该模式下支持最多导出 1000 条查询记录。
- 新增查询条件【复制】功能,优化页面体验。
- 查询组件优化:简单查询的【by 分组】支持自由拖动调整顺序。
- 查看器:
- 调整所有查看器,分析模式下隐藏趋势图显示。
- SSO:
- 优化 SSO 用户工作空间列出逻辑,修复因无访问权限自动退出登录的问题。
DataKit 更新¶
- 新加功能
- 添加 ECS Fargate 采集模式
- 添加 promremote 采集器 tag 白名单
- 问题修复
- 修复 PostgreSQL 采集器版本检测问题
- 修复 ElasticSearch 采集器帐号权限设置问题
- 修复 hostdir 采集器采集磁盘根目录崩溃问题
- 功能优化
- 优化 DDTrace 采集器:去除 message.Mate 中重复的标签
- 优化容器内日志文件的路径搜寻策略
- 优化拨测采集器,指标增加 datakit_version 字段以及采集时间设置为任务开始执行的时间
- 优化二进制包大小,移除了 datakit export 命令
- 优化时间线算法,调试采集器配置 中增加采集点的时间线数量
- 优化 hostdir 采集器采集时间戳同步
- 优化 profile 使用磁盘缓存实现异步化上报
集成更新¶
- 新增集成:APISIX
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.75.146(2023 年 12 月 05 日)¶
pubrepo.guance.com/dataflux/1.75.146:launcher-fabca4a-1701858102
私有部署版更新¶
- 部署版中心 Pipeline 支持,增加系统及工作空间级别控制开关
观测云更新¶
- 数据访问规则相关优化,支持日志查看器选择索引时根据当前账号角色关联的数据访问规则范围列出可选索引列表
- 其他一些 bug 修复
1.75.145(2023 年 11 月 30 日)¶
pubrepo.guance.com/dataflux/1.75.145:launcher-1d8dd47-1701400875
私有部署版更新¶
- 管理后台调整:
- 新增支持自定义邮件首尾以及 Logo 等显示文案;
- 观测云将取消 Banner 信息的设置,不再提供维护 Banner 信息的相关支持。
观测云更新¶
- 监控:
- 新建监控器 > 事件内容 > 插入链接:支持根据检测指标自动生成跳转链接,可在插入链接后调整过滤条件和时间范围;支持自定义跳转链接。
- 告警策略管理:新增【智能聚合】模式,您可以根据 "标题" 或 "内容" 聚类分组周期内产生的事件,每个分组将产生一条告警通知。
- 管理:
- 该模块菜单页面整体风格优化。
- 新增【属性声明】:通过固定字段 organization、business 帮助在全局中快速识别并进行联动查询。
- 新增【正则表达式】:可切换查看【自定义】和【模版库】列表;其中支持用户自定义正则表达式模板并应用到【快照分享】和【数据访问规则】。
- 工单管理:
- 工单由“账号级别”调整为“工作空间级别”,所有成员都可以查看工作空间内的全部工单;
- 新增【所有工单】列表、【提交人】以及【我的工单】列表。
- 空间管理:解散空间操作新增风险确认提示。
- 工作空间【描述】功能下线处理。
- 数据转发:查询和统计调整优化
- 查询侧:调整内容显示数据范围,默认显示除 time 以外的其他数据内容;
- 针对数据转发功能做了一些健壮性优化。
- 日志:
- 数据访问:
- 新增数据脱敏规则,支持配置多个字段并应用多个正则表达式;
- 支持配置全部【索引】和【角色】;
- 新增脱敏预览,以便判断规则是否能满足需求。
- 快照 > 分享快照:
- 分享链接有效时间新增 1、3、7天,默认选中 1 天;
- 数据脱敏:支持配置多个字段并应用多个正则表达式;
- 支持预览快照,您可以提前查看所有已配置的页面效果。
- 数据访问:
- RUM:【新建应用】页面布局调整,优化使用体验。
- 聚类分析:
- RUM > Error 查看器 & APM > 错误追踪:聚类分析模式下调整为 drain() 算法聚合逻辑;新增输入框可修改聚类字段,默认为 error_message,最多可输入3个字段,也可根据需要自定义聚类字段。
DataKit 更新¶
- 新加功能
- Redis 采集器新增 hotkey 指标
- monitor 命令支持播放 bug report 中的指标数据
- Oracle 采集器增加自定义查询
- Container 容器内的日志文件支持通配采集
- Kubernetes Pod 指标支持 network 和 storage 字段采集
- RUM 新增配置支持对会话重放进行过滤
- 问题修复
- 修复 cgroup 在某些而环境下出现的 panic 错误
- 修复 Windows 安装脚本在低版本 PowerShell 下执行失败
- 修复磁盘缓存默认开启问题
- 调整 Kubernetes Auto-Discovery 的 Prom 指标集命名风格
- 功能优化
- 优化内置采集器模板视图和监控器视图导出逻辑以及更新 MySQL / PostgreSQL / SQLServer 视图模板
- 优化 Prom 采集器自身指标名称
- 优化 Proxy 采集器,提供基本性能测试基准
- 容器日志采集支持添加所属 Pod 的 Labels
- 采集 Kubernetes 数据时默认使用 NODE_LOCAL 模式,需要添加额外的 RBAC
- 优化链路处理流程
- 重构 PinPoint 采集器,优化上下级关系
- API 支持丢弃 message 字段以节约存储
集成更新¶
- 新增集成:logstash
最佳实践更新¶
- 新增最佳实践:异常追踪与 JIRA 实现双向联动最佳实践
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.74.143(2023 年 11 月 16 日)¶
pubrepo.guance.com/dataflux/1.74.143:launcher-b218b62-1700553377
观测云更新¶
- 监控器:
- 【告警沉默】功能回归,仍可通过告警沉默配置定义重复告警通知的时间间隔。
- 删除 ”紧急“、”重要“、”警告“触发条件必须配置任意一项的限制,现支持任意配置紧急、重要、警告、数据断档、信息的其中一种触发条件。
- 基础设施存活监测:支持指标配置基础设施的存活检测,可通过此模式定义检测频率更高的存活检测配置。
- 场景:
- 图表:
- 高级设置:【原始间隔】参数配置下线,默认配置调整为【自动对齐】,支持自定义选择图表默认情况下数据的时间间隔。
- 时序图:【显示密度】调整为【最大返回点数】,默认值为 720,支持定义 2-1000 之间的任意整数。
- 修复了 PromQL 联动视图变量后导致别名功能失效的问题。
- 图表:
- 服务管理:
- 新增内置切换下拉框,您可直接在此处选择切换服务无需回到清单列表。
- 详情页中 POD 页面下线。
- 【资源调用】性能图表变更为组合图表显示,优化页面展示体验
- 管理
- SSO 管理:
- SSO 登录时,工作空间支持列出当前【身份提供商 ID】下所有授权的工作空间;支持通过【搜索】功能直接定位目标工作空间。
- 【用户 SSO】 新增【导入/导出】功能,从而快速配置多个工作空间单点登录配置。
- 工作空间语言:
- 控制台默认显示语言逻辑调整,默认跟随浏览器语言显示配置。
- 当修改工作空间语言版本时,事件、告警、短信等通知模版也将使用修改后的语言模版。
- 事件关联异常追踪新增联动标识:
- 未恢复事件列表中可通过图标了解当前事件是否关联了某个异常追踪。
- 异常追踪:若存在由监控器同步创建关联的事件信息,可通过图标快速了解关联的事件数量。
- 基础设施 > 主机:优化主机查看器指标数据排序不准的问题。
- Pipeline 使用体验的若干优化:
- 数据来源选择列新增已配置过 Pipeline 脚本的文案提示
- 日志数据获取测试样本新增 ”索引“ 选择,解决用户未使用默认索引导致获取不到样本数据问题
- SSO 管理:
观测云部署版更新¶
- 单点登录:支持用户账号通过 OIDC 登录时,根据返回的用户信息动态追加手机号信息。
DataKit 更新¶
- 新加功能
- 支持 OceanBase MySQL 模式采集
- 新增数据录制/播放功能
- 问题修复
- 修复 Windows 低版本资源限制无效问题
- 功能优化
- 优化 statsd 采集
- 优化 Datakit 安装脚本
- 优化 MySQL 内置视图
- 完善 Datakit 自身指标暴露,增加完整 Golang 运行时等多项指标
- 其它文档优化以及单元测试优化
- 完善 Redis 指标采集,增加更多指标
- TCP 拨测中允许增加报文(只支持 ASCII 文本)检测
- 优化非 root 用户安装时的问题
- 可能因 ulimit 设置失败无法启动
- 完善文档,增加非 root 安装时的受限功能描述
- 调整非 root 安装时的前置操作,改为用户手动配置,避免不同操作系统可能存在的命令差异
- MongoDB 采集器增加对老版本 2.8.0 的支持
- RabbitMQ 采集器增加对低版本(3.6.X/3.7.X)的支持
- 优化 Kubernates 中 Pod 指标采集,以替换原始 Metric Server 方式
- Kubernates 下采集 Prometheus 指标时允许增加指标集名称配置
集成更新¶
- 新增集成 argocd 、 fluentd
- 更新集成 redis-sentinel
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.73.142(2023 年 11 月 02 日)¶
pubrepo.guance.com/dataflux/1.73.142:launcher-546eb3e-1699281153
观测云部署版更新¶
- 支持账号会话失效时长自定义配置,对前台用户统一设置登录会话保持时间。
观测云更新¶
- 管理:
- SSO 管理:支持 OIDC / Oauth2.0 协议的单点登录配置;
- 数据权限管理:添加授权时新增【角色】,配置角色后,被授权的工作空间做数据查看时会根据选择的角色范围,判断数据的查询访问限制和脱敏限制。
- 数据转发:
- 导航位置调整至【管理】模块,仍可通过原【日志】、【用户访问监测】、【应用性能监测】的导航栏二级菜单进入【数据转发】;
- AWS S3 和阿里云 OSS 支持“跨账号授权”配置,实现两个账号之间互相授权数据权限,简化了配置流程。
- 付费计划与账单:
- 支持数据转发到观测云内部存储,统计每天出账时工作空间内保存到观测云存储对象的数据容量大小;
- 事件 > 未恢复事件:
- 目前,未恢复事件列表保存近 24 小时内的事件数据;
- 新增显示偏好:默认展示【标准】模式,支持选择【扩展】模式来打开事件检测结果值历史趋势;
- 支持将当前事件列表导出 CSV;
- 事件详情页新增扩展字段 Tab 页;基础属性Tab 页页面优化。
- 基础设施 > 网络:
- 优化【总览】模板,新增快捷筛选,用户可以过滤查看网络路径。新增 5 个统计图表,支持分析发送/接收字节数、TCP 重传等网络指标信息;
- 新增【网络流】查看器,可以查看时间线上的所有 L4(netflow)、L7(httpflow) 网络流数据;
- 其他查看器详情页新增【拓扑】模式展示,可直接查看当前对象的网络上下游关系以及一些网络关键指标。
- 场景:
- 视图变量:支持添加 PromQL 方式查询;
- 图表:
- 针对 Doris 数据存储的工作空间新增【数据采样】;
- 时间自动对齐功能优化:针对所有指标数据和 Doris 数据的图表查询,当开启时间自动对齐功能时,返回数据的时间点将按“整秒/整分/整小时”对齐;
- 排行榜、概览图、表格图:新增【规则映射】,可为映射数值范围内的数据配置相应的字体色/背景色。
- 查看器:分析模式优化,在支持基于数据自由地进行聚合查询,并以图表形式展示分析;
- 服务管理 > 资源调用:资源排行榜新增【每秒请求数】选项。
- 可用性监测 > 任务:支持导入、导出。
- Doris 日志数据引擎下暂不支持 with_labels 联动查询。
DataKit 更新¶
- 新加功能
- 新增 OceanBase 采集
- 问题修复
- 修复 Tracing 数据中较大 Tag 值兼容,现已调至 32MB
- 修复 RUM session replay 脏数据问题
- 修复指标信息导出问题
- 功能优化
- 主机目录采集和磁盘采集中,新增挂载点等指标
- KafkaMQ 支持 OpenTelemetry Tracing 数据处理
- Bug Report 新增更多信息收集
- 完善 Prom 采集过程中自身指标暴露
- 更新默认 IP 库以支持 IPv6
- 更新镜像名下载地址为 pubrepo.guance.com
- 优化日志采集文件位置功能
- Kubernetes
- 支持 Node-Local Pod 信息采集,以缓解选举节点压力
- 容器日志采集支持更多粒度的过滤
- 增加 service 相关的指标采集
- 支持筛选 PodMonitor 和 ServiceMonitor 上的 Label 功能
- 支持将 Node Label 转换为 Node 对象的 Tag
- 兼容调整
- Kubernetes 不再采集 Job/CronJob 创建的 Pod 的 CPU/内存指标
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.72.141(2023 年 10 月 28 日)¶
pubrepo.guance.com/dataflux/1.72.141:launcher-9c1d6ec-1698481094
私有部署版更新¶
- 修复安装程序的一些 bug
1.72.140(2023 年 10 月 24 日)¶
pubrepo.guance.com/dataflux/1.72.140:launcher-b2acabc-1698160292
私有部署版更新¶
- 支持在部署时选择 GuanceDB 作为默认时序引擎
- 一些其他已知 bug 修复
1.72.139(2023 年 10 月 19 日)¶
pubrepo.guance.com/dataflux/1.72.139:launcher-27b5e0f-1697980093
私有部署版更新¶
- 新增自定义映射规则配置:启用该配置后,对应工作空间可以自定义映射规则。工作空间的自定义映射规则优先级大于管理后台的映射规则;
- 新增查询数量上限:针对不同用户的工作空间的查询数量有定制化的限制,避免因查询数据量过大导致集群查询性能低,影响产品使用体验;
- 本地账号新增更换密码。
观测云更新¶
- 付费计划与账单:计费项【数据转发】目前按照数据转发规则,分别统计转发数据量进行计费。
- 管理
- SSO 管理:支持创建多个 SSO 的 IDP 配置,并支持针对单个 IDP 配置进行启用、禁用操作、开启 SAML 映射。
- 数据权限管理 > 敏感数据脱敏:支持基于角色级别配置敏感数据屏蔽规则,配置时可采用正则表达式脱敏,支持针对某个数据类型下的字段做脱敏规则配置,并由此新增脱敏规则预览测试。
- 监控器:新增外部事件检测,将第三方系统产生的异常事件或记录通过指定 URL 地址,以 POST 请求方式发送到 HTTP 服务器后生成观测云的事件数据。
- 场景
- 服务管理 > 资源调用:新增针对对应列表进行数量排序,默认从大到小;
- 图表链接:新增基于当前选中数据点的开始时间和结束时间做传参,变量分别为 #{timestamp.start}、#{timestamp.end};
- 图表别名:基于图例序列进行配置;
- 表格图:新增【时序表格图】。
- 指标 > 指标分析:表格图新增【时序模式】。
DataKit 更新¶
- Pod 添加 cpu_limit 指标
- New Relic 链路数据接入
- 优化 logfwd 的退出逻辑,避免因为配置错误导致程序退出影响到业务 Pod
- 优化 ElasticSearch采集器,增加索引指标集 elasticsearch_indices_stats 分片和副本等指标
- 增加 disk 集成测试
- DataKit monitor 支持 HTTPS
- Oracle 采集器添加慢查询日志
- 优化采集器 point 实现
- MongoDB 采集器集成测试增加检测授权功能
- 修复日志单行数据太长可能导致的内存问题
- 修复 disk 采集器磁盘挂载点获取失败问题
- 修复 helm 和 yaml 中的 Service 名称不一致问题
- 修复 pinpoint span 中缺失 agentid 字段
- 修复采集器中 goroutine group 错误处理问题
- 修复MongoDB 采集器空数据上报问题
- 修复 rum 采集器请求中出现大量 408 和 500 状态码
集成更新¶
- PagerDuty:当我们的应用程序或系统出现异常时,通常需要及时处理以保证系统的正常运行。为了更好地管理和跟踪异常事件,我们可以将这些事件发送到 PagerDuty 中创建事件,这样我们就可以在 PagerDuty 中进行跟踪、分析和解决这些问题,通过快速地将异常事件发送到 PagerDuty 中创建事件,为我们提供更好的管理和跟踪异常事件的能力,从而更好地保证系统的正常运行。同时,这种方法也可以帮助我们更好地分析和解决问题,提高系统的稳定性和可靠性。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.71.138(2023 年 10 月 13 日)¶
pubrepo.guance.com/dataflux/1.71.138:launcher-74c9d6a-1697164060
此版本是 fix 版本,主要有如下更新:
观测云更新¶
- 优化各个类型的数据查看器查询性能
- 修复一些其他已知 bug
1.71.137(2023 年 09 月 21 日)¶
pubrepo.guance.com/dataflux/1.71.137:launcher-ee43f34-1695727144
观测云更新¶
- 日志:
- 数据转发:新增外部存储转发规则数据查询;支持启用/禁用转发规则;
- 绑定索引:日志易新增标签绑定,从而实现更细颗粒度的数据范围查询授权能力。
- 基础设施 > 自定义:
- 【默认属性】这一概念更改为【必有属性】:上报的数据中必须包含该属性字段,否则将会上报失败;
- 支持将资源目录添加至二级菜单,便于查看。
- 自定义查看器新增快捷筛选。
- 场景:
- 定时报告:新增【钉钉】【企业微信】【飞书】三种通知方式;
- 图表:【时序图、饼图、柱状图、直方图、散点图、气泡图、表格图、矩形树图、漏斗图、排行榜、地图、蜂窝图】新增数据格式,可以定义【小数位数】以及【千分位分隔符】。
- 监控 > 通知对象管理:邮件组类型下架,已创建的不受影响。
- 快照:分享快照:新增 IP 白名单访问限制。
- 异常追踪:【等级】支持自定义创建;支持启用/禁用默认等级。
- 集成 > 扩展:DataFlux Func 托管版和 RUM Headless 现支持海外站点:俄勒冈,法兰克福,新加坡。
DataKit 更新¶
- 新增 Neo4j 采集器
- RUM 采集器新增 sourcemap 文件上传、删除和校验接口,并移除 DCA 服务中 sourcemap 上传和删除接口
- 新增 IBM Db2 采集器的监控视图和检测库
- 修复环境变量 ENV_GLOBAL_HOST_TAGS 中使用 __datakit_hostname 无法获取主机 hostname 的问题
- 修复 host_processes 采集器指标数据缺少 open_files 字段
- 修复 Pinpoint 采集器 resource 大量为空的情况和 Pinpoint 占用内存过高问题
- 优化 Kubernetes 指标采集和对象采集的效率
- 优化日志采集的 metrics 输出
- Kubernetes Node 对象采集添加 unschedulable 和 node_ready 两个新字段
- Oracle 采集器支持 Linux ARM64 架构
- logstreaming 采集器增加集成测试
- Datakit 开发文档中增加 IBM Db2 采集器内容
- Kafka、MongoDB 采集器文档完善
- MySQL 采集器监控帐号创建时,MySQL 8.0+ 默认采用caching_sha2_password 加密方式
- 优化 bug report 命令采集 syslog 文件过大问题
- 删除 DCA 服务中的 sourcemap 文件上传和删除接口,相关接口移至 RUM 采集器
集成更新¶
- Huawei CCE:观测云支持对 CCE 中各类资源的运行状态和服务能力进行监测,包括 Containers、Pods、Services、Deployments、Clusters、Nodes、Replica Sets、Jobs、Cron Jobs 等。您可以在 Kubernetes 中通过 DaemonSet 方式安装 DataKit,进而完成对 Kubernetes 资源的数据采集。最终,在观测云中实时监测 Kubernetes 各类资源的运行情况。
- Huawei CSS(Elasticsearch):华为云搜索服务 CSS for Elasticsearch 的核心性能指标包括查询延迟、索引速度、搜索速度、磁盘使用率和 CPU 使用率,这些都是评估和优化 Elasticsearch 性能的关键指标。
- Huawei SYS.AS:华为 SYS.AS 的核心性能指标包括 CPU 利用率、内存使用率、磁盘I/O、网络吞吐量和系统负载等,这些都是评估和优化自动缩放系统性能的关键指标。
- Huawei ASM:华为云的 ASM 的链路追踪数据输出到观测云,进行查看、分析。
- AWS CloudFront:AWS CloudFront 的核心性能指标包括请求总数、数据传输量、HTTP 错误率、缓存命中率和延迟,这些可以帮助用户评估和优化内容分发网络的性能。
- AWS MediaConvert:AWS MediaConvert 包括数据传输、视频报错、作业数、填充等。
- AWS Aurora Serverless V2:AWS Aurora Serverless V2,包括连接数、IOPS、队列、读写延迟、网络吞吐量等。
- AWS Redshift:AWS Redshift 的核心性能指标包括查询性能、磁盘空间使用率、CPU 利用率、数据库连接数和磁盘 I/O 操作,这些都是评估和优化数据仓库性能的关键指标。
- AWS Simple Queue Service:AWS Simple Queue Service 的展示指标包括队列中最旧的未删除消息的大约存在时间、延迟且无法立即读取的消息数量、处于空中状态的消息的数量、可从队列取回的消息数量等。
- AWS Timestream:AWS Timestream 的展示指标包括系统错误数(内部服务错误数)、当前 AWS 区域和当前 AWS 帐户的无效请求的总和、成功请求经过的时间和样本数量、存储在内存中的数据量以及存储在磁存储器中的数据量等。
- AWS Neptune Cluster:AWS Neptune Cluster 的展示指标包括冷启动时间、执行时间、并发执行数和内存使用量,这些指标反映了 Neptune Cluster函数的响应速度、可扩展性和资源利用情况。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.70.136(2023 年 09 月 07 日)¶
pubrepo.guance.com/dataflux/1.70.136:launcher-6ccb06b-1694354213
观测云更新¶
- 场景 > 仪表板/查看器:新增全局跨工作空间查询配置。
- 场景 > 图表查询:时间控件范围小于等于【最近 15 分钟】,自动对齐时间间隔新增 “1 秒”显示。
- 场景 > 服务管理:
- 服务清单新增绑定多个内置视图到分析看板;新增关联、团队信息;
- 新增资源调用分析看板;
- 支持保存快照。
- 日志 > 备份日志:
- 正式更改为数据转发;
- 新增链路、用户访问数据源;
- 原备份日志计费项名称更改为数据转发计费项。
- 日志 > 查看器:新增新建监控器入口;支持针对查看器详情页做快照保存。
- 管理:
- 全局标签:新增全局标签功能,对标签进行统一管理;
- 字段管理:新增别名、设置显示列;
- 空间管理:功能整合和页面优化;
- 成员管理:原成员组的定义正式更改为团队;
- 敏感数据扫描:新增扫描规则数量统计;新增跳转链接。
- 监控:
- 可用性数据检测:新增拨测指标,可以基于【指标】维度进行检测;
- 突变、离群、区间检测:支持选择所有数据源。
DataKit 更新¶
- 新加功能:
- Windows 支持内存/CPU 限制
- 新增 IBM Db2 采集器
- 问题修复:
- 修复容器采集配置 include/exclude 的 double star 问题
- 修复一处 k8s Service 对象数据的字段错误
- 功能优化:
- DataKit 精简版支持 logging 模块
- bug report 支持禁用 profile 数据采集
- 增加不同 Trace 传递说明的文档
- Pipeline 增加函数 parse_int 和 format_int
- Pipeline 数据聚合函数 agg_create 和 agg_metric 支持输出任意类别的数据
- 优化 Datakit 镜像大小
- 优化 --bug-report 命令,可关闭 Profile 收集(避免给当前 Datakit 造成压力)
- 增加Datakit 指标性能测试报告
- 增加external 采集器的使用文档
集成更新¶
- 阿里云:
- aliyun_analyticdb_postgresql:阿里云 AnalyticDB PostgreSQL 指标展示,包括 CPU、内存、磁盘、协调节点、实例查询等。
- aliyun_clickhouse_community:阿里云 ClickHouse 指标展示,包括服务状态、日志流量、操作次数、总体 QPS 等。
- aliyun_kafka:阿里云 KafKa 包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 Kafka 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
- aliyun_lindorm:包括高吞吐量、低延迟的数据读写能力,支持高并发的事务处理,以及强一致性和高可靠性的数据存储和查询服务。
- aliyun_polardb_1.0:阿里云 PolarDB 分布式 1.0 展示指标包括CPU利用率、内存利用率、网络带宽和磁盘 IOPS。
- aliyun_polardb_2.0:阿里云 PolarDB 分布式 2.0 展示计算层和存储节点的指标,包括 CPU 利用率、连接使用率、磁盘使用量、磁盘使用率、内存利用率、网络带宽等。
- aliyun_rds_postgresql:阿里云 RDS PostgreSQL 指标展示,包括 CPU 使用率、内存使用率等。
- aliyun_rocketmq5:阿里云 RocketMQ 5.0 的展示指标包括消息吞吐量、延迟、可靠性和水平扩展能力等。
- AWS:
- aws_dynamodb_DAX:AWS DynamoDB DAX 的展示指标包括节点或集群的 CPU 使用率、在所有网络接口上收到或发出的字节数、数据包的数量等,这些指标反映了 DynamoDB DAX 的运行状态。
- aws_memorydb:AWS MemoryDB 的核心性能指标包括低延迟的内存读写能力、高并发的事务处理能力,以及可线性扩展的存储容量和吞吐量。
- 华为云:
- huawei_functiongraph:HUAWEI FunctionGraph 的展示指标包括调用次数,错误次数,被拒绝次数,并发数,预留实例个数,运行时间(包括最大运行时间、最小运行时间、平均运行时间)等,这些指标反映了 FunctionGraph 函数运行情况。
- huawei_kafka:包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 Kafka 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
- huaweiyun_SYS_DDMS:'华为云 SYS.DDMS 监控视图展示指标包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 DDMS 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
- 腾讯云:
- tencent_keewidb:腾讯云 KeeWiDB 指标展示,包括连接数、请求、缓存、key、慢查询等。
- tencent_mariadb:包括高性能的读写能力、低延迟的查询响应时间,以及支持高并发的事务处理和扩展性能。
- tencent_memcached:包括高速的内存读写能力、低延迟的数据访问时间,以及高并发的访问处理能力。
- tencent_tdsql_c_mysql:包括高吞吐量的读写能力、低延迟的查询响应时间,以及支持高并发的事务处理和可扩展性能。
- 其他:
- openai:OpenAI的展示指标包括请求总数,响应时间,,请求数量,请求错误数和消耗token数。
- monitor_jira:当我们的应用程序或系统出现异常时,通常需要及时处理以保证系统的正常运行。为了更好地管理和跟踪异常事件,我们可以将这些事件发送到 Jira 中创建事件,这样我们就可以在 Jira 中进行跟踪、分析和解决这些问题,通过快速地将异常事件发送到 Jira 中创建事件,为我们提供更好的管理和跟踪异常事件的能力,从而更好地保证系统的正常运行。同时,这种方法也可以帮助我们更好地分析和解决问题,提高系统的稳定性和可靠性。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.69.135(2023 年 08 月 24 日)¶
pubrepo.guance.com/dataflux/1.69.135:launcher-7130e81-1693313758
部署版更新¶
- 管理后台映射规则新增仅针对新加入成员应用适配规则,用户启用选择该选项时,映射规则适配仅针对首次加入成员生效。
观测云更新¶
- 计费项:
- 备份日志:新增 OSS、OBS、AWS S3、Kafka 四种存档类型计费项,基于用户选择的对应存档类型统计汇总转发的流量大小,并根据数据对应出账;
- 应用性能 Trace、用户访问 PV 新增 30天/60天的数据存储策略。
- 监控:
- 静默规则:支持基于不同维度配置告警沉默。
- 监控器:支持为监控器添加标签,根据标签过滤列表;监控器列表增加快捷筛选列,并对列表进行了一些优化;
- SLO:新增故障时间显示列。
- 日志 > 备份日志:新增 Kafka 消息队列外部存储。
- 查看器/仪表板:新增自动刷新功能。
- 查看器详情页:新增绑定内置视图入口。
- 场景 > SLO 图表:新增故障时间显示。
DataKit 更新¶
- 新增采集器 NetFlow
- 新增黑名单调试器
- 新增 Kubernetes StatefulSet 指标和对象采集,新增 replicas_desired 对象字段
- 新增 DK_LITE 环境变量,用于安装 DataKit 精简版
- 修复 Container 和 Kubernetes 采集没有正确添加 HostTags 和 ElectionTags 的问题
- 修复 MySQL 自定义采集 Tags 为空时指标无法采集的问题
- 增加 System 采集器中的 process_count 指标表示当前机器的进程数
- 去掉 Process 采集器中的 open_files_list 字段
- 增加主机对象采集器文档中指标丢失的处理案例
- 优化 Datakit 视图,完善 Datakit Prometheus 指标文档
- 优化 Pod/容器 日志采集的 mount 方式
- 增加 Process、System 采集器集成测试
- 优化 etcd 集成测试
- 升级 Golang 1.19.12
- 增加通过 ash 命令安装 DataKit
- RUM 采集支持自定义指标集,默认的指标集新增 telemetry
- 移除 Datakit 端的 Sinker 功能,将其功能转移到 Dataway 侧实现
- 移除 Kubernetes Deployment 指标数据的 pasued 和 condition 字段,新增对象数据 paused 字段
智能巡检更新¶
- 阿里云 RDS MariaDB:阿里云 RDS MariaDB 的展示指标包括响应时间、并发连接数、QPS 和 TPS 等。
- 阿里云 RocketMQ4:阿里云 RocketMQ 4.0 的展示指标包括消息吞吐量、延迟、可靠性和水平扩展能力等。
- 阿里云 Tair 社区版:阿里云 Tair 社区版指标展示包括 CPU 使用率、内存使用率、代理总QPS、网络流量、命中率等。
- AWS DynamoDB:AWS DynamoDB 的展示指标包括吞吐量容量单位(Capacity Units)、延迟、并发连接数和读写吞吐量,这些指标反映了 DynamoDB 在处理大规模数据存储和访问时的性能表现和可扩展性。
- AWS EventBridge:AWS EventBridge 的展示指标包括事件传递延迟、吞吐量、事件规模和可伸缩性,这些指标反映了 EventBridge 在处理大规模事件流和实时数据传递时的性能表现和可靠性。
- AWS Lambda:AWS Lambda 的展示指标包括冷启动时间、执行时间、并发执行数和内存使用量,这些指标反映了 Lambda 函数的响应速度、可扩展性和资源利用情况。
- HUAWEI SYS.AS:HUAWEI SYS.AS 的展示指标包括响应时间、并发连接数、吞吐量和可靠性,这些指标反映了 SYS.AS 在处理应用程序请求和数据交互时的性能表现和稳定性。
- HUAWEI SYS.CBR:HUAWEI SYS.CBR 的展示指标包括带宽利用率、延迟、丢包率和网络吞吐量,这些指标反映了CBR在网络传输和带宽管理方面的性能表现和质量保证。
- 华为云 GaussDB-Cassandra:华为云 GaussDB-Cassandra 的展示指标包括读写吞吐量、延迟、数据一致性和可扩展性,这些指标反映了 GaussDB-Cassandra 在处理大规模分布式数据存储和访问时的性能表现和可靠性。
- 华为云 GaussDB for MySQL:华为云 GaussDB for MySQL 的展示指标包括响应时间、并发连接数、读写吞吐量和可扩展性,这些指标反映了 GaussDB for MySQL 在处理大规模关系型数据库操作时的性能表现和可靠性。
- 华为云 GaussDB-Influx:华为云 GaussDB-Influx 的展示指标包括写入吞吐量、查询延迟、数据保留策略和可扩展性,这些指标反映了 GaussDB-Influx 在处理大规模时序数据存储和查询时的性能表现和可靠性。
- 华为云 GaussDB-Redis:华为云 GaussDB-Redis 的展示指标包括读写吞吐量、响应时间、并发连接数和数据持久性,这些指标反映了 GaussDB-Redis 在处理高并发数据存储和缓存时的性能表现和可靠性。
- 华为云 GaussDB SYS.GAUSSDBV5:华为云 GaussDB SYS.GAUSSDBV5,提供 CPU、内存、磁盘、死锁、SQL 响应时间指标等数据。
- 华为云 MongoDB:华为云 MongoDB 的展示指标包括读写吞吐量、延迟、并发连接数和数据可靠性,这些指标反映了 MongoDB 在处理大规模文档存储和查询时的性能表现和可扩展性。
- 华为云 RDS PostgreSQL:华为云 RDS PostgreSQL 的展示指标包括查询性能、事务吞吐量、并发连接数和数据可靠性,这些指标反映了 RDS PostgreSQL 在处理大规模关系型数据存储和事务处理时的性能表现和可靠性。
- 腾讯云 CKafka:腾讯云 CKafka 的展示指标包括消息吞吐量、延迟、并发连接数和可靠性,这些指标反映了 CKafka 在处理大规模消息传递和实时数据流时的性能表现和可靠性保证。
- Zadigx:Zadigx 展示包括概览、自动化构建、自动化部署、自动化测试等。
- 飞书与异常追踪联动:为方便更加及时可方便的获取异常追踪中的新 Issue,可以通过在内部群中创建一个飞书、钉钉或者企业微信的机器人来接受异常追踪中的新 Issue 或新回复的提醒,帮助及时处理 Issue;也可以通过 @机器人的这种方式来快速进行 Issue 回复,提高我们的异常处理效率。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.68.134(2023 年 08 月 10 日)¶
pubrepo.guance.com/dataflux/1.68.134:launcher-9651bb3-1691936534
观测云更新¶
- 新增计费项定时报告:按工作空间内定时报告单日发送的次数出账计费。
- 场景新增服务管理:服务管理是一个用于访问所有服务关键信息的集中入口,用户可查看当前工作空间内不同服务的性能和业务数据及所有的关联分析等信息,快速定位并解决服务的相关问题。
- 场景图表均支持 PromQL 查询和表达式查询。
- 日志:支持在日志详情页直接查看上下文日志;可选择上下文检索范围。
- 查看器:打开某条数据详情页,支持一键导出当前数据为 JSON 文件。
- 应用性能监测 > 服务 > 调用拓扑:新增当前服务的上下游调用关系表格,展示服务单向关系的请求数、平均响应时间和错误数。
- 监控器 > 阈值检测:检测指标新增转换为 PromQL 查询。
- 基础设施 > 容器:Pods、Services、Deployments、Nodes、Replica Sets、Cron Jobs、Daemonset 详情页新增 Kubernets 事件组件。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.67.133(2023 年 07 月 27 日)¶
pubrepo.guance.com/dataflux/1.67.133:launcher-3840753-1690897331
私有部署版更新¶
- 在进行版本升级时,不再更新整个 Workload 的 YAML 文件,这意味着升级版本不会导致 Workload 的个性化配置被重置
观测云更新¶
- 场景 > 仪表板:新增定时报告功能,支持用户创建基于某仪表板的报告,并可以配置定时邮件发送;
- 导航栏新增 邀请成员 入口,可通过该入口快速邀请成员。在管理页面,新增邀请审批按钮。该按钮开启情况下,向成员发送邀请后,须移至邀请记录审批管理成员加入申请。
- 日志 > 备份日志有以下调整:
- 观测云默认存档类型下线:
- 新创建的备份规则中将不再支持【观测云】默认选项;
- 历史已创建的备份规则依然生效。
- 新增支持备份到外部存储阿里云 OSS。
- 监控 > 新建:支持将监控器保存为自定义模板库,以便后续用户快速创建同类型监控器检测。
- 监控 > 新建监控器 > 自定义新建:除【突变检测】【区间检测】【离群检测】以外,所有检测规则的检测频率新增【最近 12 小时】【最新 24 小时】选项。
- 异常追踪:新建 Issue 页面新增投递频道配置入口,支持多选;等级新增未知选项,默认选中该选项。
- 为满足用户数据合规性要求,快照支持针对字段通过正则语法对某些内容脱敏。
- 场景 >日志流图:新增 Copy as cURL、导出为 CSV 文件功能。
- 用户访问监测 > 查看器 > Error:新增 聚类分析 功能,方便查看发生频次较高的错误。
- 新增数据上限提示:即日志、链路等数据量到达今日上限,将停止数据接收,如需调整,请联系客户经理。
DataKit 更新¶
-
新加功能
- HTTP API 增加 sourcemap 文件上传
- 新增 .net Profiling 接入支持
- 新增 Couchbase 采集器
-
问题修复
- 修复拨测采集器缺失 owner 字段问题
- 修复 DDTrace 采集器缺失 host 问题,同时各类 Trace 的 tag 采集改为黑名单机制
- 修复 RUM API 跨域问题
-
功能优化
- 优化 SNMP 采集器加密算法识别方法;优化 SNMP 采集器文档,增加更多示例解释
- 增加 Pythond 采集器 Kubernetes 部署示例,增加 gitrepo 部署示例
- 增加 InfluxDB、Solr、NSQ、Net 采集器集成测试
- 增加 Flink 指标
- 扩展 Memcached、MySQL 指标采集
- 更新 Datakit 自身指标暴露
- Pipeline 增加更多运算符支持
- 拨测采集器
- 增加拨测采集器内置仪表板
- 优化拨测任务启动,避免资源集中消耗
- 文档更新
- 其它优化
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.66.132(2023 年 07 月 11 日)¶
pubrepo.guance.com/dataflux/1.66.132:launcher-2c2a83a-1689171482
观测云更新¶
- 观测云国际站“EU1(Frankfurt)”正式上线。
- 集成升级:点击任意集成方案,即可在同一页面上了解从配置接入、数据采集到数据应用的全链路使用方案。
- 监控器 > 模板 功能优化:支持基于单个检测规则创建或批量创建;支持基于检测库进行筛选。
- 应用性能监测 > 链路:Span 列表页面新增瀑布图模式,帮助用户以更直观的视角分析 Span 数据信息;服务调用关系 从服务(service)变更为服务资源(service / resource)级别,通过下钻到接口级别来更好地分析对应的性能及调用问题,从而通过接口级别的调用帮助用户更快发现问题点。
- 图表 > 概览图:新增千位分隔符;单位 > 数值中,“默认”改为“万进制”;值映射中新增空值映射。
- 图表 > 矩形树图:新增显示值选项,选中可在图中直接显示查询结果值。
- 图表 > 添加链接:新增 query 参数,删除 tags、search 两个参数。
- 应用性能监测 > 服务列表支持导出。
智能巡检更新¶
-
功能优化
- 应用性能巡检:新增默认检测阈值更改入口,现在在开启巡检时可以同步需改需要检测服务的触发值。
- RUM 性能巡检:对页面详情模块中根因展示逻辑进行优化,优化后,根因定位更加准确。
- 工作空间资产巡检:新增默认配置(7 天),现在开启巡检不需要参数也可以运行。
-
新增脚本
- 云消息队列 RocketMQ4.0
- 华为云-CSS
- 华为云-RocketMQ
- 华为云-RabbitMQ
- 华为云-WAF-事件列表
- 华为云-WAF-事件概览
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.65.131(2023 年 06 月 20 日)¶
pubrepo.guance.com/dataflux/1.65.131:launcher-d6c2ef5-1687506944
观测云更新¶
- RUM (Real User Monitoring) 采集器用于收集网页端或移动端上报的用户访问监测数据。现提供 RUM Headless一键开通服务,实现自动化安装部署在观测云的云主机中,自动完成 DataKit 安装,RUM 采集器部署。只需要手动接入应用即可。
- 查看器:优化筛选、搜索的交互转化等逻辑,让用户真正做到所见即所得,且能够在 UI 和手写模式自由切换。另:日志查看器支持的 DQL 手写模式新版本上线后将会做下线处理。
- 日志 > 备份日志:新增外部存储类型选择,支持写入 S3(AWS) 对象存储、支持华为云 OBS 数据写入。
- 日志 > 索引:新增日志易数据绑定配置入口。
- 仪表板/内置视图支持根因分析和下钻分析。
- 管理 > 角色管理:支持克隆已有用户角色减少操作步骤,快速增减权限并创建角色。
- 基础设施 > 容器:新增 Daemonset 对象数据显示,可拖拽改变对象分类显示顺序。
- 基础设施 > 容器:Deployments、Pods 支持直接关联 kubernetes 事件日志,在详情页可直接查看具体日志信息。
- 新增异常追踪 OpenAPI 接口。
- 管理 > 成员管理列表、监控 > 通知对象管理 > 邮件组、异常追踪 > 查看成员、所有选择通知对象处均支持按成员昵称进行检索。
- 工单状态更新或有新回复时,通过界面或者邮件提醒客户关注。
- 文本输入框输入不合法的字符或长度限制提示优化。
DataKit 更新¶
- 新增 Chrony 采集器
- 新增 RUM Headless 支持
- Pipeline
- 新增 offload 功能
- 调整已有的文档结构
- 在 Datakit HTTP API 返回中增加更多信息,便于错误排查
- RUM 采集器增加更多 Prometheus 指标暴露
- 默认开启 Datakit 的 pprof 功能,便于问题排查
智能巡检更新¶
- 新增巡检
- AWS Cloudtrail 异常事件巡检:帮助快速识别问题并采取适当的纠正措施,以减少服务中断时间和业务影响。
- 新增脚本
- 观测云集成(阿里云-RDS错误日志):收集阿里云的 RDS 错误日志,用于 RDS 的错误信息诊断;
- filebeats 数据采集器:收集 FileBeats 性能数据用于观测 FileBeats 性能、延迟等场景;
- logstash 数据采集器:收集 Logstash 性能数据用于观测 Logstash 性能、延迟等场景。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.64.130(2023 年 06 月 12 日)¶
pubrepo.guance.com/dataflux/1.64.130:launcher-e504618-1686575695
此版本是 fix 版本,主要有如下更新:
观测云部署版更新¶
- 修复私有部署版 OIDC 对接的一些 bug。
- 修复其他一些小 bug。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.64.129(2023 年 06 月 08 日)¶
pubrepo.guance.com/dataflux/1.64.129:launcher-ad357b8-1686206775
观测云部署版更新¶
- 管理后台新增密码安全策略:新增密码 8 位长度限制及密码有效期功能。
观测云更新¶
- 为进一步满足用户数据查看需求,商业版付费计划与账单新增设置高消费预警功能,新增消费分析列表,支持查看各类支出消费统计。
- 创建工作空间时新增菜单风格选择,支持选择不同的工作空间风格属性。
- 优化日志数据访问权限相关规则适配,进一步明确多角色数据查询权限及权限控制对应关系。
- 事件详情页下的基础属性下的检测维度新增关联查询,支持查看筛选当前检测维度下全部字段值的关联数据。
- 告警策略管理支持不同级别告警到不同的通知对象。
- 成员管理新增添加昵称备注功能,规范工作空间内的成员用户名,支持通过昵称备注搜索成员。
- 仪表板、查看器、监控、成员管理、分享管理等页面列表新增批量操作功能。
- 应用性能监测服务支持修改颜色,支持表头排序调整。
- 日志、应用性能监测 > 错误追踪查看器聚类分析支持对文档数量排序,默认倒叙。
- 支持保存登录选择语言版本到浏览器本地,再次登录自动显示上一次登录选择语言版本。
- 生成指标频率选项调整,支持选择 1 分钟、5 分钟、15 分钟。
智能巡检更新¶
- 新增巡检
- 工作空间资产巡检
- 新增脚本
- gitlab 研发效能分析:根据 gitlab 的代码提交频率和每次代码量,分团队、个人、时间维度展示团队的研发效能。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.63.128(2023 年 05 月 22 日)¶
pubrepo.guance.com/dataflux/1.63.128:launcher-d07d641-1685285792
私有部署版更新¶
- 支持选择使用私有拨测服务或 SaaS 拨测服务中心
观测云更新¶
- RUM 应用配置新增自定义类型和关联视图查看分析
- DQL 函数支持正则聚合数据统计显示返回
- 新增 PromQL 语法查询入口,支持通过 PromQL 查询时序数据
- show_tag_value() 函数支持查询对应指标字段的关联标签
- 小程序 SDK 支持采集启动参数相关的信息;新增自定义添加 Error
- Status Page 支持订阅故障通知
- 新增字段管理功能,在监控器、图表查询、查看器等位置若选择了相关字段则显示对应的描述和单位信息
- 指标分析新增表格功能,支持下载
- 工单状态调整
- 新增异常追踪引导页,频道新增时间范围筛选
- 备份日志优化:
- 新增备份规则入口移至备份日志 > 备份管理
- 新增全部备份逻辑:不添加筛选即表示保存全部日志数据
智能巡检更新¶
- 新增巡检
- 云上闲置资源巡检
- 主机重启巡检
- 功能优化
- 闲置主机巡检:新增对云主机类型关联添加费用相关信息。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.62.127(2023 年 04 月 20 日)¶
pubrepo.guance.com/dataflux/1.62.127:launcher-c737a19-1683555353
观测云更新¶
- 计费更新
- 观测云自研时序引擎 GuanceDB 全新上线,时序数据存储及计费将会做如下调整:
- 基础设施(DataKit)计费项下线,原 “DataKit + 时间线”、“仅时间线” 两种计费模式按照仅 GuanceDB 时间线作为出账逻辑使用;
- GuanceDB 时间线:统计当天活跃的时间线数量计费,单价低至 ¥0.6 / 每千条时间线。
- 用户访问监测 “会话重放” 正式启动付费,按照实际采集会话重放数据的 session 数量计费,¥10 / 每千个 Session。
- 功能更新
- GuanceDB 时序引擎全新上线
- 异常追踪新功能上线
- 跨站点工作空间授权功能上线
- SLS 新增第三方授权开通或绑定
- 绑定索引配置页面优化,支持自定义添加映射字段配置
- 命令面板新增本地 Func 的自定义函数选择
- 时序图新增高级函数,支持本地 Func 根据 DQL 查询结果二次处理后返回显示
- 工作空间新增时区配置,用户可自定义配置当前工作空间查询时间的时区
- 智能巡检优化脚本集开启步骤,新增新增 AWS 同步多种认证方式、AWS Cloudwatch Logs 同步
- 集成 - DataKit 页面引导优化
- 查看器柱状分布图新增统计时间区间显示
- 导航菜单支持右键选择新页打开
- 黑名单重名导入问题修复
- 私有部署版更新
- 新增账号登录映射规则配置,根据不同的映射规则动态分配成员加入的工作空间及对应的角色。
DataKit 更新¶
- 新增 Pinpoint API 接入
- 优化 Windows 安装脚本和升级脚本输出方式,便于在终端直接黏贴复制
- 优化 Datakit 自身文档构建流程
- 优化 OpenTelemetry 字段处理
- Prom 采集器支持采集 info 类型的 label 并将其追加到所有关联指标上(默认开启)
- 在 system 采集器 中,新增 CPU 和内存占用百分比指标
- Datakit 在发送的数据中,增加数据点数标记(X-Points),便于中心相关指标构建
- 优化 Datakit HTTP 的 User-Agent 标记,改为 datakit-
- / 形态 - KafkaMQ:
- 支持处理 Jaeger 数据
- 优化 SkyWalking 数据的处理流程
- 新增第三方 RUM 接入功能
- SkyWalking 新增 HTTP 接入功能
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.61.126(2023 年 04 月 06 日)¶
pubrepo.guance.com/dataflux/1.61.126:launcher-d290e0d-1681300585
观测云更新¶
- 日志新增 3 天数据保存策略和定价,计费相关请参考文档计费方式。
- 日志新增数据访问权限控制,支持将某个范围内的日志数据查看权限授予给相关角色
- 角色权限清单新增各功能模块数据查询权限,支持自定义角色配置对应模块的数据查询权限入口
- 标准成员新增 “快照管理” 权限,支持快照增删操作
- 快照分享支持搜索功能。(日志 DQL 查询模式下不支持调整搜索范围)
- 支持本地 Func 通过 websocket 协议创建自定义的通知对象,实现外部通知渠道接收告警通知
- 查看器新增copy as cURL数据查询功能
- 仪表板图表配置交互优化
- 概览图新增数值单位选项配置,支持选择中国科学记数法进位(default)和短级差制(short scale)
- 新增视图变量是否应用到图表效果显示
- 图表存在分组条件时,支持将某个分组条件值反向应用到视图变量实现联动筛选
- 图表存在分组条件时,选中某个分组条件对应时间线或数据点时支持其他图表中相同分组联动高亮显示
- 图表拖拽效果优化
- 账号无操作会话过期时间默认调整为 3 小时,此次调整仅针对未编辑过无操作会话过期时间配置的账号,不影响已编辑过的无操作会话过期时间配置的账号。
- 筛选历史新增搜索条件保存
- 用户访问监测应用 SDK 接入引导优化
- 生成指标配置优化,支持针对新生成的指标配置单位和描述
- 主机查看器支持多行显示,多行模式下 label 将另起一行显示
- 时序图、饼图新增返回显示数量配置
DataKit 更新¶
- 新加功能
- 新增伺服服务,用来管理 Datakit 升级
- 新增故障排查功能
- 功能优化
- 优化升级功能,避免 datakit.conf 文件被破坏
- 优化 cgroup 配置,移除 CPU 最小值限制
- 优化 self 采集器,我们能选择是否开启该采集器,同时对其采集性能做了一些优化
- Prom 采集器允许增加 instance tag,以保持跟原生 Prometheus 体系一致
- DCA 增加 Kubernetes 部署方式
- 优化日志采集的磁盘缓存性能
- 优化 Datakit 自身指标体系,暴露更多 Prometheus 指标
- 优化 /v1/write
- 优化安装过程中 token 出错提示
- monitor 支持自动从 datakit.conf 中获取连接地址
- 取消 eBPF 对内核版本的强制检查,尽量支持更多的内核版本
- Kafka 订阅采集支持多行 json 功能
- 优化 IO 模块的配置,新增上传 worker 数配置字段
- 兼容调整
- 本次移除了大部分 Sinker 功能,只保留了 Dataway 上的 Sinker 功能。同时 sinker 的主机安装配置以及 Kubernetes 安装配置都做了调整,其中的配置方式也跟之前不同,请大家升级的时候,注意调整
- 老版本的发送失败磁盘缓存由于性能问题,我们替换了实现方式。新的实现方式,其缓存的二进制格式不再兼容,如果升级的话,老的数据将不被识别。建议先手动删除老的缓存数据(老数据可能会影响新版本磁盘缓存),然后再升级新版本的 Datakit。尽管如此,新版本的磁盘缓存,仍然是一个实验性功能,请谨慎使用
- Datakit 自身指标体系做了更新,原有 DCA 获取到的指标将有一定的缺失,但不影响 DCA 本身功能的运行
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.60.125(2023 年 03 月 23 日)¶
pubrepo.guance.com/dataflux/1.60.125:launcher-6723827-1679932675
私有部署版更新¶
- 解决了在部署过程中无法使用包含复杂字符密码的中间件的问题
- 提升了在部署过程中自动生成的数据库账号密码的复杂度
观测云更新¶
- 帮助文档搜索功能优化
- 备份日志新增扩展字段保存逻辑
- 查看器/仪表板时间控件新增“时区选择”和“全局锁定”功能
- 监控器优化
- 支持查看上次的历史配置,支持点击还原到历史配置版本
- 列表和页面新增创建、变更信息显示
- 突变检测新增对比维度,支持选择跟“昨日”“上一小时”统计指标比对逻辑
- 智能巡检事件新增效果反馈入口
- 快照分享支持添加“创建人”水印显示
- 注册开通流程优化,云市场开通路径新增站点选择
- 笔记创建逻辑和添加内容交互调整
- 图表查询新增 label 反选逻辑
- 链路详情页 Span 列表显示逻辑调整,按“持续时间”倒序显示
- 成员管理触发审核流程后角色修改逻辑调整
- 查看器列宽度保存、日志显示多行等逻辑调整
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
1.59.124(2023 年 03 月 09 日)¶
pubrepo.guance.com/dataflux/1.59.124:launcher-cfaec26-1679407401
观测云更新¶
- 数据存储策略变更优化
- 图表链接配置优化
- 新增支持创建重名的仪表板、笔记、自定义查看器
- DQL 参数生效优先级调整
- 日志 Message 数据展示优化
- 监控配置页面优化
- SSO 相关优化
- 其他功能优化
- 商业版开通流程支持 “观测云直接开通”、“阿里云市场开通“和“亚马逊云市场开通“三种方式任意选择;
- 查看器左 * 查询功能范围调整,新开通的工作空间不再默认支持左 * 查询,如有需求请联系客户经理;
- SLIMIT 限制调整,时序图查询若存在 group by 分组时,默认返回最多 20 条数据;
- 新创建的工作空间新手引导流程优化。
DataKit 更新¶
- 新加功能
- Pipeline 支持 key 删除
- Pipeline 增加新的 KV 操作
- Pipeline 增加时间函数
- netstat 支持 IPV6
- diskio 支持 io wait 指标
- 容器采集允许 Docker 和 Containerd 共存
- 整合 Datakit Operator 配置文档
- 功能优化
- 优化 Point Checker
- 优化 Pipeline replace 性能
- 优化 Windows 下 Datakit 安装流程
- 优化 confd 配置处理流程
- 添加 Filebeat 集成测试能力
- 添加 Nginx 集成测试能力
- 重构 OTEL Agent
- 重构 Datakit Monitor 信息
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
v1.58.123(2023 年 03 月 07 日)¶
pubrepo.guance.com/dataflux/1.58.123:launcher-a4e6282-1678200092
此版本是 fix 版本,主要有如下更新:
观测云更新¶
- 修复 Profiling 的数据过期清理的 bug
- 修复 DQL series_sum 函数计算逻辑的 bug
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
v1.58.122(2023 年 03 月 04 日)¶
pubrepo.guance.com/dataflux/1.58.122:launcher-08db157-1677907360
此版本是 fix 版本,主要有如下更新:
观测云更新¶
- 修复 RUM Session Replay 功能播放时 bug
- 一些其他小 bug 修复
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
v1.58.121(2023 年 02 月 23 日)¶
pubrepo.guance.com/dataflux/1.58.121:launcher-105a217-1677566915
观测云更新¶
- 用户访问监测优化
- 新增用户访问监测自动化追踪
- 用户访问监测应用列表、查看器、分析看板布局整体调整
- 新增 CDN 质量分析
- 场景优化
- 新增自定义查看器导航菜单
- 增强场景视图变量级联功能
- 饼图新增合并配置选项
- 其他功能优化
- 观测云商业版注册流程支持绑定观测云费用中心账号;
- 配置监控器时,「检测维度」支持非必选。
- 图表查询中 match / not match 运算符翻译逻辑调整,日志类数据中 match 去除默认右 * 匹配逻辑。
DataKit 更新¶
- 新加功能
- 命令行增加解析行协议功能
- Datakit yaml 和 helm 支持资源 limit 配置
- Datakit yaml 和 helm 支持 CRD 部署
- 添加 SQL-Server 集成测试
- RUM 支持 resource CDN 标注
- 功能优化
- 优化拨测逻辑
- 优化 Windows 下安装提示
- 优化 powershell 安装脚本模板
- 优化 k8s 中 Pod, ReplicaSet, Deployment 的关联方法
- 重构 point 数据结构及功能
- Datakit 自带 eBPF 采集器二进制安装
更多详情可参考帮助文档:https://docs.guance.com/release-notes/
v1.57.120(2023 年 01 月 12 日)¶
pubrepo.guance.com/dataflux/1.57.120:launcher-e5345d3-1675061598
观测云更新¶
- 观测云英文语言支持
- 新增观测云站点服务 Status Page
- 新增绑定自建 Elasticsearch / OpenSearch 索引
- 新增网络查看器列表模式
- 新增前端应用 Span 请求耗时分布显示
- 优化用户访问监测 Session 交互逻辑
- Pod 指标数据采集默认关闭
- 其他功能优化
- 绑定 MFA 认证调整为邮箱验证
- 注册时调整手机验证为邮箱验证
- 登录时安全验证调整为滑块验证
- 创建工作空间新增观测云专属版引导
- 工作空间新增备注显示功能
- 云账号结算用户新增在观测云付费计划与账单查看账单列表
- 表格图支持基于 「by 分组」设置别名
- 优化监控器配置中的时序图,仅在选择维度后显示
- 优化日志类数据数据断档告警配置
- OpenAPI 新增创建接口
最佳实践更新¶
- 云平台接入:AWS - EKS 部署 DataKit。
- 监控 Monitoring:应用性能监控 (APM) - 调用链 - 使用 datakit-operator 注入 dd-java-agent。
更多详情可参考帮助文档:https://docs.guance.com/release-notes/