跳转至

指标


指标是观测云系统中用于持续追踪系统状态的核心数据单元,由数值、时间戳和维度标签三部分组成。它以时间序列形式记录可量化的系统特征(如资源利用率、业务吞吐量),通过标签(如主机、服务、地域)实现多维度分析,为实时监控、性能优化及趋势预测提供精准数据支撑。

数据架构

观测云的指标数据处理分为三层:

  • 采集层:由 DataKit 完成,负责从主机、应用、中间件等源头抓取原始指标。

  • 传输层:DataKit 将数据加密后,通过 HTTP/HTTPS 发送至观测云的数据中心。

  • 存储与分析层:观测云对数据进行清洗、存储,并提供可视化分析能力。

关键角色

DataKit 是部署在用户环境中的轻量级代理(类比 Prometheus 的 Exporters),直接对接数据源,承担采集、预处理、安全传输的核心职责。

数据组成

一个完整的指标数据单元包含三个核心要素:

  • 指标集(Measurement):数据的分类标识(如 cpu 表示 CPU 指标)。

  • 标签(Tags):用于数据过滤和分组的维度(如 host=server01, region=cn)。

  • 字段(Fields):具体的数值型指标(如 usage=58.3)。

例如:

cpu,host=server01,core=0 usage_user=12.3,usage_system=5.7 1690524000000000000
  • 指标集:cpu

  • 标签:host=server01, core=0(标记数据来源的服务器和 CPU 核心)

  • 字段:usage_user=12.3(用户空间 CPU 使用率), usage_system=5.7(系统空间使用率)

  • 时间戳:1690524000000000000(2023-07-28 12:00:00 UTC)

应用场景

通过 DataKit 采集的指标数据,可服务于各类关键业务场景,帮助实现从技术运维到业务决策的全链路洞察。例如:

  • 业务运营分析:量化核心业务指标(如用户活跃度、交易成功率、功能使用率),关联技术数据与业务结果;
  • 应用性能优化:追踪服务接口响应耗时、错误率、吞吐量等性能指标,识别代码逻辑或依赖服务的性能瓶颈;
  • 资源成本控制:通过监测云资源利用率与成本分布,定位闲置或低效实例;
  • 安全与合规管理:监控异常登录行为、敏感操作频率等安全指标,识别潜在风险并触发自动化响应,满足审计与合规要求。

文档评价

文档内容是否对您有帮助? ×