指标¶
指标是观测云系统中用于持续追踪系统状态的核心数据单元,由数值、时间戳和维度标签三部分组成。它以时间序列形式记录可量化的系统特征(如资源利用率、业务吞吐量),通过标签(如主机、服务、地域)实现多维度分析,为实时监控、性能优化及趋势预测提供精准数据支撑。
数据架构¶
观测云的指标数据处理分为三层:
-
采集层:由 DataKit 完成,负责从主机、应用、中间件等源头抓取原始指标。
-
传输层:DataKit 将数据加密后,通过 HTTP/HTTPS 发送至观测云的数据中心。
-
存储与分析层:观测云对数据进行清洗、存储,并提供可视化分析能力。
关键角色¶
DataKit 是部署在用户环境中的轻量级代理(类比 Prometheus 的 Exporters),直接对接数据源,承担采集、预处理、安全传输的核心职责。
数据组成¶
一个完整的指标数据单元包含三个核心要素:
-
指标集(Measurement):数据的分类标识(如
cpu
表示 CPU 指标)。 -
标签(Tags):用于数据过滤和分组的维度(如
host=server01
,region=cn
)。 -
字段(Fields):具体的数值型指标(如
usage=58.3
)。
例如:
-
指标集:
cpu
-
标签:
host=server01
,core=0
(标记数据来源的服务器和 CPU 核心) -
字段:
usage_user=12.3
(用户空间 CPU 使用率),usage_system=5.7
(系统空间使用率) -
时间戳:
1690524000000000000(2023-07-28 12:00:00 UTC)
应用场景¶
通过 DataKit 采集的指标数据,可服务于各类关键业务场景,帮助实现从技术运维到业务决策的全链路洞察。例如:
- 业务运营分析:量化核心业务指标(如用户活跃度、交易成功率、功能使用率),关联技术数据与业务结果;
- 应用性能优化:追踪服务接口响应耗时、错误率、吞吐量等性能指标,识别代码逻辑或依赖服务的性能瓶颈;
- 资源成本控制:通过监测云资源利用率与成本分布,定位闲置或低效实例;
- 安全与合规管理:监控异常登录行为、敏感操作频率等安全指标,识别潜在风险并触发自动化响应,满足审计与合规要求。