常见 Tag 整理¶
在 DataKit 采集的数据中,Tag 是所有数据的关键字段,它影响数据的过滤和分组,一旦 Tag 数据有误,将导致 Web 页面数据展示错误。另外,Tag 的标定还会影响时序数据的用量统计。故在设计和变更 Tag 的过程中,应该深思熟虑,全盘考虑对应的变动是否会造成相关的问题。本文档主要列举一下当前 DataKit 中常见的 Tag,一来用以明确每个 Tag 的具体意义,二来,在未来新加 Tag 的时候,应该沿用、遵循以下这些 Tag 的命名和标定,避免出现不一致的情况。
下面将从全局 Tag 和特定数据类型专属 Tag 两个维度来进行罗列。
全局类 Tag¶
这些 Tag 跟具体数据类型无关,它可以追加到任意数据类型上。
Tag | 描述 |
---|---|
host | 主机名,DaemonSet 安装和主机安装都能带上这个 tag,在某些特定的情况下,用户可以 rename 这个 tag 的值 |
project | 项目名,一般都是由用户设置 |
cluster | 集群名,一般在 DaemonSet 安装中,由用户设置 |
election_namespace | 选举所在的命名空间,默认不追加,详见文档 |
version | 版本号,所有涉及版本信息的 tag 字段,都应该以该 tag 来表示 |
Kubernetes/容器常见 Tag¶
这些 tag 在采集到的数据中,一般都会有追加,但涉及时序采集的时候,默认会忽略一些多变的 tag(比如 pod_name
),以节约时间线。
Tag | 描述 |
---|---|
pod_name |
Pod 名称 |
deployment |
K8s 中 Deployment 名称 |
service |
K8s 中 Service 名称 |
namespace |
K8s 中 Namespace 名称 |
job |
K8s 中 Job 名称 |
image |
K8s 中 镜像全称 |
image_name |
K8s 中镜像名简称 |
container_name |
Ks8/容器中的容器名 |
cronjob |
K8s 中 CronJob 名称 |
daemonset |
K8s 中 DaemonSet 名称 |
replica_set |
K8s 中 ReplicaSet 名称 |
node_name |
K8s 中 Node 名称 |
node_ip |
K8s 中 Node IP |
按特定数据类型的 Tag 分类¶
日志¶
Tag | 描述 |
---|---|
source | 日志来源,在行协议上,它并不是以 tag 形式存在,而是作为指标集名称,但中心将其作为 tag 存为日志的 source 字段 |
service | 日志的 service 名称,如果不填写,其值等同于 source 字段 |
status | 日志等级,如果不填写,采集器会默认将其值置为 unknown ,常见的 status 列表在这里 |
对象¶
Tag | 描述 |
---|---|
class | 对象分类,在行协议上,它并不是以 tag 形式存在,而是作为指标集名称,但中心将其作为 tag 存为对象的 class 字段 |
name | 对象名称,中心会结合 hash(class + name) 来唯一确定某个工作空间中的对象 |
指标¶
指标由于数据来源纷杂,除了全局类 tag 外,没有固定的 tag。
APM¶
Tracing 类数据的 tag 统一在这里
RUM¶
详见 RUM 文档:
Scheck¶
参见 Scheck 对应文档
Profile¶
参见采集器文档
Network¶
参见采集器文档
Event¶
参见设计文档