常见问题¶
指标采集相关¶
如何查看指标是否成功上报?
可通过以下方式验证:
- 控制台:进入指标 > 指标管理,查看对应指标集是否存在;
- 命令行:执行
datakit monitor查看采集器运行状态 - 日志:查看 DataKit 日志
tail -f /var/log/datakit/log
指标数据未采集如何处理?
- 检查 DataKit 运行状态:
systemctl status datakit - 检查采集器配置是否正确:
/usr/local/datakit/conf.d/目录下对应采集器配置 - 检查网络连通性:DataKit 是否能正常访问数据源
- 查看 DataKit 日志排查错误
Prometheus 指标如何接入观测云?
支持三种方式:
- 通过 Prometheus Remote Write 直接推送至 DataKit
- 通过 Prometheus Push Gateway 推送
- 在 Kubernetes 中部署 Prometheus Exporter,由 DataKit 自动采集
指标管理相关¶
时间线数量过多会有什么影响?
时间线数量直接影响:
- 存储成本:时间线越多,存储费用越高
- 查询性能:大量时间线可能导致查询变慢
建议优化标签设计,避免使用高基数标签(如 user_id、ip 等动态值)。官方标签规范要求禁止动态标签,仅使用静态业务标签(如 env、project)。
如何修改指标存储时长?
- 全局设置:管理 > 空间设置 > 危险操作 > 变更数据存储策略 > 指标;
- 单指标集设置:指标 > 指标管理 > 点击指标集右侧存储策略图标
每次修改策略都会触发立即数据删除,原策略下的该指标集数据会被永久删除且无法恢复。指标集自定义设置的优先级高于工作空间全局设置。
指标单位和描述如何修改?
进入指标 > 指标管理,点击指标集名称,展开指标列表,点击操作列的编辑按钮即可修改单位和描述。在指标管理中自定义的单位和描述优先级高于默认采集数据。
生成指标相关¶
生成指标后为什么查询不到数据?
可能原因:
- 生成规则未启用
- 数据来源在查询时间范围内无数据
- 数据延迟超过 1 分钟(生成指标不统计延迟超过 1 分钟的数据)
- 未拥有“生成指标配置管理权限”
生成指标的频率如何选择?
- 1 分钟:适用于实时性要求高的场景(默认)
- 5 分钟:适用于基础对象和资源目录(默认)
- 15 分钟:适用于趋势分析,对实时性要求不高的场景
频率越低,时间线数量越少,存储成本越低。
生成指标支持哪些数据源?
支持从以下数据源生成指标:
- 日志
- APM
- RUM
- 指标(基于现有指标计算新指标)
- 可用性监测
- 基础对象(主机、容器等)
- 资源目录
通用问题¶
指标数据保留多长时间?
默认保留 7 天,支持自定义:
- 商业版:3 天、7 天、14 天、30 天、180 天、360 天、720 天、1080 天
- 部署版:支持 1-1800 天任意整数
如何优化指标存储成本?
- 合理设置存储策略,非核心指标缩短保留时间
- 优化标签设计,避免高基数标签(遵循禁止动态标签规范)
- 使用生成指标聚合原始数据,减少时间线数量
- 定期清理无用指标集
DQL 和 PromQL 有什么区别?
- DQL:观测云自研查询语言,支持简单查询、表达式查询,语法简洁
- PromQL:Prometheus 原生查询语言,指标数据额外支持
两者都可在指标分析和可视化图表中使用。