跳转至

主机对象


主机对象采集器用于收集主机基本信息,如硬件型号、基础资源消耗等。

配置

成功安装 Datakit 并启动后,会默认开启主机对象采集器,无需手动开启。

进入 DataKit 安装目录下的 conf.d/host 目录,复制 hostobject.conf.sample 并命名为 hostobject.conf。示例如下:

[inputs.hostobject]

## Datakit does not collect network virtual interfaces under the linux system.
## Setting enable_net_virtual_interfaces to true will collect network virtual interfaces stats for linux.
# enable_net_virtual_interfaces = true

## absolute path to the configuration file
# config_path = ["/usr/local/datakit/conf.d/datakit.conf"]

##############################
# Disk related options
##############################
## Deprecated
# ignore_fs = ["tmpfs", "devtmpfs", "devfs", "iso9660", "overlay", "autofs", "squashfs", "aufs"]

## We collect all devices prefixed with dev by default,If you want to collect additional devices, it's in extra_device add
# extra_device = []

## exclude some with dev prefix (We collect all devices prefixed with dev by default)
# exclude_device = ["/dev/loop0","/dev/loop1"]

## Physical devices only (e.g. hard disks, cd-rom drives, USB keys)
# and ignore all others (e.g. memory partitions such as /dev/shm)
only_physical_device = false

# merge disks that with the same device name(default false)
# merge_on_device = false

## Ignore the disk which space is zero
ignore_zero_bytes_disk = true

## Disable cloud provider information synchronization
disable_cloud_provider_sync = false

## Enable put cloud provider region/zone_id information into global election tags, (default to true).
# enable_cloud_host_tags_as_global_election_tags = true

## Enable put cloud provider region/zone_id information into global host tags, (default to true).
# enable_cloud_host_tags_as_global_host_tags = true

## [inputs.hostobject.tags] # (optional) custom tags
  # cloud_provider = "aliyun" # aliyun/tencent/aws/hwcloud/azure/volcengine, probe automatically if not set
  # some_tag = "some_value"
  # more_tag = "some_other_value"
  # ...

## [inputs.hostobject.cloud_meta_url]
  # tencent = "xxx"  # URL for Tencent Cloud metadata
  # aliyun = "yyy"   # URL for Alibaba Cloud metadata
  # aws = "zzz"
  # azure = ""
  # Hwcloud = ""
  # volcengine = ""

配置好后,重启 DataKit 即可。

可通过 ConfigMap 方式注入采集器配置配置 ENV_DATAKIT_INPUTS 开启采集器。

也支持以环境变量的方式修改配置参数(需要在 ENV_DEFAULT_ENABLED_INPUTS 中加为默认采集器):

  • ENV_INPUT_HOSTOBJECT_ENABLE_NET_VIRTUAL_INTERFACES

    允许采集虚拟网卡

    字段类型: Boolean

    采集器配置字段: enable_net_virtual_interfaces

    默认值: false

  • ENV_INPUT_HOSTOBJECT_IGNORE_ZERO_BYTES_DISK

    忽略大小为 0 的磁盘

    字段类型: Boolean

    采集器配置字段: ignore_zero_bytes_disk

    默认值: false

  • ENV_INPUT_HOSTOBJECT_ONLY_PHYSICAL_DEVICE

    忽略非物理磁盘(如网盘、NFS),任意非空字符串

    字段类型: Boolean

    采集器配置字段: only_physical_device

    默认值: false

  • ENV_INPUT_HOSTOBJECT_EXCLUDE_DEVICE

    忽略的 device

    字段类型: List

    采集器配置字段: exclude_device

    示例: /dev/loop0,/dev/loop1

  • ENV_INPUT_HOSTOBJECT_EXTRA_DEVICE

    额外增加的 device

    字段类型: List

    采集器配置字段: extra_device

    示例: /nfsdata,other

  • ENV_INPUT_HOSTOBJECT_CLOUD_META_AS_ELECTION_TAGS

    将云服务商 region/zone_id 信息放入全局选举标签

    字段类型: Boolean

    采集器配置字段: enable_cloud_host_tags_global_election_tags

    默认值: true

  • ENV_INPUT_HOSTOBJECT_CLOUD_META_AS_HOST_TAGS

    将云服务商 region/zone_id 信息放入全局主机标签

    字段类型: Boolean

    采集器配置字段: enable_cloud_host_tags_global_host_tags

    默认值: true

  • ENV_INPUT_HOSTOBJECT_TAGS

    自定义标签。如果配置文件有同名标签,将会覆盖它

    字段类型: Map

    采集器配置字段: tags

    示例: tag1=value1,tag2=value2

  • ENV_CLOUD_PROVIDER

    指定云服务商

    字段类型: String

    采集器配置字段: none

    示例: aliyun/aws/tencent/hwcloud/azure

  • ENV_CLOUD_META_URL

    云服务商元数据 URL 映射

    字段类型: Map

    采集器配置字段: cloud_meta_url

    示例: {"tencent":"xxx", "aliyun":"yyy"}

开启云同步

Datakit 默认开启云同步,目前支持阿里云/腾讯云/AWS/华为云/微软云/火山引擎。可以通过设置 cloud_provider tag 显式指定云厂商,也可以由 Datakit 自动进行探测:

[inputs.hostobject.tags]
  # 此处目前支持 aliyun/tencent/aws/hwcloud/azure 几种,若不设置,则由 Datakit 自动探测并设置此 tag
  cloud_provider = "aliyun"

可以通过在配置文件中配置 disable_cloud_provider_sync = true 关闭云同步功能。

对象

以下所有数据采集,默认会追加名为 host 的全局 tag(tag 值为 DataKit 所在主机名),也可以在配置中通过 [inputs.hostobject.tags] 指定其它标签:

 [inputs.hostobject.tags]
  # some_tag = "some_value"
  # more_tag = "some_other_value"
  # ...

注意:这里添加自定义 tag 时,尽量不要跟已有的 tag key/field key 同名。如果同名,DataKit 将选择配置里面的 tag 来覆盖采集的数据,可能导致一些数据问题。

HOST

  • 标签
Tag Description
arch Host OS Arch
host Hostname. Required.
name Hostname
os Host OS type
unicast_ip Host unicast ip
  • 指标列表
Metric Description Type Unit
cpu_usage CPU usage float percent
datakit_ver Collector version string -
disk_total Disk total int B
disk_used_percent Disk usage float percent
diskio_read_bytes_per_sec Disk read rate int B/S
diskio_write_bytes_per_sec Disk write rate int B/S
dk_upgrader Upgrade's host and port string -
is_docker Docker mode int -
load System load float -
logging_level Log level string -
mem_used_percent Memory usage float percent
message Summary of all host information string -
net_recv_bytes_per_sec Network receive rate int B/S
net_send_bytes_per_sec Network send rate int B/S
num_cpu CPU numbers int count
start_time Host startup time (Unix timestamp) int ms

如果开启了云同步,会多出如下一些字段(以同步到的字段为准):

字段名 描述 类型
cloud_provider 云服务商 string
description 描述 string
instance_id 实例 ID string
instance_name 实例名 string
instance_type 实例类型 string
instance_charge_type 实例计费类型 string
instance_network_type 实例网络类型 string
instance_status 实例状态 string
security_group_id 实例分组 string
private_ip 实例私网 IP string
zone_id 实例 Zone ID string
region 实例 Region ID string

message 指标字段结构

message 字段基本结构如下:

{
  "host": {
    "meta": ...,
    "cpu": ...,
    "mem": ...,
    "net": ...,
    "disk": ...,
    "conntrack": ...,
    "filefd": ...,
    "election": ...,
    "config_file": ...,
  },

  "collectors": [ # 各个采集器的运行情况
    ...
  ]
}

host.meta

字段名 描述 类型
host_name 主机名 string
boot_time 开机时间 int
os 操作系统类型,如 linux/windows/darwin string
platform 平台名称,如 ubuntu string
platform_family 平台分类,如 ubuntu 属于 debian 分类 string
platform_version 平台版本,如 18.04,即 Ubuntu 的某个分发版本 string
kernel_release 内核版本,如 4.15.0-139-generic string
arch CPU 硬件架构,如 x86_64/arm64 string
extra_cloud_meta 开启云同步时,会带上一串云属性的 JSON 数据 string

host.cpu

字段名 描述 类型
vendor_id 供应商 ID,如 GenuineIntel string
module_name CPU 型号,如 Intel(R) Core(TM) i5-8210Y CPU @ 1.60GHz string
cores 核数 int
mhz 频率 int
cache_size L2 缓存大小(KB) int

host.mem

字段名 描述 类型
memory_total 总内存大小 int
swap_total: swap 大小 int

host.net

字段名 描述 类型
mtu 最大传输单元 int
name 网卡名称 string
mac MAC 地址 string
flags 状态位(可能多个) []string
ip4 IPv4 地址 string
ip6 IPv6 地址 string
ip4_all 所有 IPv4 地址 []string
ip6_all 所有 IPv6 地址 []string

host.disk

之前的版本中,同一个设备只会采集一个挂载点(具体采集哪一个,以具体挂载点在 /proc/self/mountpoint 出现的顺序为准)。在 Version-1.66.0 版本中,主机对象中的磁盘部份会将符合条件(比如设备名以 /dev 开头)挂载点都采集上来,其目的是为了展示 Datakit 能看到的所有设备,避免遗漏。

字段名 描述 类型
device 磁盘设备名 string
total 磁盘总大小 int
mountpoint 挂载点 string
fstype 文件系统类型 string

host.election

注意:当配置文件中 enable_election 选项关闭时,该字段为 null

字段名 描述 类型
elected 选举状态 string
namespace 选举空间 string

host.conntrack

Attention

conntrack 仅 Linux 平台支持

字段名 描述 类型
entries 当前连接数量 int
entries_limit 连接跟踪表的大小 int
stat_found 成功的搜索条目数目 int
stat_invalid 不能被跟踪的包数目 int
stat_ignore 已经被跟踪的报数目 int
stat_insert 插入的包数目 int
stat_insert_failed 插入失败的包数目 int
stat_drop 跟踪失败被丢弃的包数目 int
stat_early_drop 由于跟踪表满而导致部分已跟踪包条目被丢弃的数目 int
stat_search_restart 由于 hash 表大小修改而导致跟踪表查询重启的数目 int

host.filefd

Attention

filefd 仅 Linux 平台支持

字段名 描述 类型
allocated 已分配文件句柄的数目 int
maximum 文件句柄的最大数目(已弃用,用 maximum_mega 替代) int
maximum_mega 文件句柄的最大数目,单位 M(10^6) float

host.config_file

config_file 是一个 file-path: file-content 的 map,每个字段的含义如下:

字段名 描述 类型
file-path 配置文件的绝对路径 string
file-content 配置文件的内容 string

采集器运行情况字段列表

collectors 字段是一个对象列表,每个对象的字段如下:

字段名 描述 类型
name 采集器名称 string
count 采集次数 int
last_err 最后一次报错信息,只报告最近 30 秒(含)以内的错误 string
last_err_time 最后一次报错时间(Unix 时间戳,单位为秒) int
last_time 最近一次采集时间(Unix 时间戳,单位为秒) int

FAQ

为什么 entriesentries_limit 采集不到,显示为 -1?

需要加载 nf_conntrack 模块,终端执行 modprobe nf_conntrack 即可。

文档评价

文档内容是否对您有帮助? ×