DataKit 选举¶

当集群中只有一个被采集对象（例如 Kubernetes），但在批量部署场景下，多个 DataKit 使用相同的配置并同时开启对该中心对象的采集时，为避免数据重复，可以启用 DataKit 的选举功能。

目前 DataKit 仅支持“自选举”模式。在同一选举命名空间下，只有一个 DataKit 实例会被选举为主节点，负责全部数据采集工作，其余实例则处于待命状态。

该模式的优缺点如下：

优点：配置简单，不需要额外部署应用
缺点：对当选者的资源占用较大，所有的采集器都在这台 DataKit 上运行，系统资源占用增多

Warning

从 DataKit Version-1.85.0 起，采集器任务选举功能已被移除，同时 DataKit-Operator v1.6.0 也不再支持相关选举接口。

DataKit 自选举模式¶

选举配置¶

datakit.confKubernetes

编辑 conf.d/datakit.conf，选举有关的配置如下：

[election]
  # 开启选举
  enable = false

  # 设置选举的命名空间(默认 default)
  namespace = "default"

  # 允许在数据上追加选举空间的 tag
  enable_namespace_tag = false

  ## election.tags: 选举相关全局标签
  [election.tags]
    #  project = "my-project"
    #  cluster = "my-cluster"

如果要对多个 DataKit 区分选举，比如这 10 DataKit 和另外 8 DataKit 分开选举，互相不干扰，可以配置 DataKit 命名空间。同一个命名空间下的 DataKit 参与同一起选举。

开启选举后，如果同时开启 enable_election_tag = true（ Version-1.4.7），则在选举类采集的数据上，自动加上 tag: election_namespace = <your-namespace-name>。

conf.d/datakit.conf 中开启选举后，在需要参加选举的采集器中配置 election = true（目前支持选举的采集器的配置文件中都带有 election 项）

注意：支持选举但配置为 election = false 的采集器不参与选举，其采集行为、tag 设置均不受选举影响；如果 datakit.conf 关闭选举，但采集器开启选举，其采集行为、tag 设置均与关闭选举相同。

参见这里

选举状态查看¶

配置完选举后，通过查看 monitor 即可知道当前 DataKit 的选举状态，在 Basic Info 栏中，有如下行：

Elected default::success|MacBook-Pro.local(elected: 4m40.554909s)

其中：

default 表示当前 DataKit 参与选举的命名空间。一个工作空间可以有多个选举专用的命名空间
success 表示当前 DataKit 开启了选举且选举成功
MacBook-Pro.local 表示当前命名空间被选上的 DataKit 所在主机名。如果该主机名就是当前这个 DataKit，则后面会显示其当选 leader 的时长（elected: 4m40.554909s） Version-1.5.8

如果是如下显示，则表示当前 DataKit 未被选上，但会显示当前是哪个主机被选上：

Elected default::defeat|host-abc

其中：

default 表示当前 DataKit 参与选举的命名空间，同上
defeat 表示当前 DataKit 开启了，但选举失败。除此之外，还有如下几种可能的状态：
- disabled：未开启选举功能
- success：选举成功完成
- banned：选举功能已开启，但自己未列在选举允许的白名单中 Version-1.35.0
host-abc 表示当前命名空间被选上的 DataKit 所在主机名

选举原理¶

以 MySQL 为例，在同一个集群（如 K8s cluster）中，假定有 10 DataKit、2 个 MySQL 实例，且 DataKit 都开启了选举（DaemonSet 模式下，每个 DataKit 的配置都是一样的）以及 MySQL 采集器：

一旦某个 DataKit 被选举上，那么所有 MySQL （其它选举类的采集也一样）的数据采集，都将由该 DataKit 来采集，不管被采集对象是一个还是多个，赢者通吃。其它未选上的 DataKit 处于待命状态。
观测云中心会判断当前选上的 DataKit 是否正常，如果异常，则强行踢掉该 DataKit，其它待命状态的 DataKit 将替代它
未开启选举的 DataKit（可能它不在当前集群中），如果也配置了 MySQL 采集，不受选举约束，它仍然会去采集 MySQL 的数据
选举的范围是「工作空间+命名空间」级别的，单个「工作空间+命名空间」中，一次最多只能有一个 DataKit 被选上
- 关于工作空间，在 datakit.conf 中，通过 Dataway 地址串中的 token URL 参数来表示，每个工作空间，都有其对应 token
- 关于选举的命名空间，在 datakit.conf 中，通过 namespace 配置项来表示。一个工作空间可以配置多个命名空间

选举类采集器的全局 tag 设置¶

datakit.confKubernetes

在 conf.d/datakit.conf 开启选举的条件下，开启了选举的采集器采集到的数据，均会尝试追加 datakit.conf 中的 global_election_tag：

[election]
  [election.tags]
    # project = "my-project"
    # cluster = "my-cluster"

如果原始数据上就带有了这里的 tag，则以原始数据中带有的 tag 为准，此处不会覆盖。

如果没有开启选举，则选举采集器采集到的数据中，均会带上 datakit.conf 中配置的 global_host_tags（跟非选举类采集器一样）： Version-1.4.8

[global_host_tags]
  ip         = "__datakit_ip"
  host       = "__datakit_hostname"

Kubernetes 中选举的配置参见这里，全局 tag 的设置参见这里。

选举白名单¶

Version-1.35.0

datakit.confKubernetes

对于独立主机安装，选举白名单通过 datakit.conf 文件进行配置：

[election]

  # 白名单列表，如果列表为空，则所有主机/node 皆可参与选举
  node_whitelist = ["host-name-1", "host-name-2", "..."]

参见这里

支持选举的采集列表¶

目前支持选举的采集器列表如下：

事实上，支持选举的采集器会更多，此处可能更新不及时，以具体采集器的文档为准。

FAQ¶

`host` 字段问题¶

对于由参与选举的采集器采集的对象，比如 MySQL，由于采集其数据的 DataKit 可能会变迁（发生了选举轮换），故默认情况下，这类采集器采集的数据不会带上 host 这个 tag，以避免时间线增长。我们建议在 MySQL 采集器配置上，增加额外的 tags 字段：

[inputs..tags]
  host = "real-mysql-instance-name"

这样，当 DataKit 发生选举轮换时，会继续沿用 tags 中配置的 host 字段。

DataKit 选举¶

DataKit 自选举模式¶

选举配置¶

选举状态查看¶

选举原理¶

选举类采集器的全局 tag 设置¶

选举白名单¶

支持选举的采集列表¶

FAQ¶

host 字段问题¶

文档内容是否对您有帮助？ ×

`host` 字段问题¶