跳转至

DataKit


概述

DataKit 是一款开源、一体式的数据采集 Agent,它提供全平台操作系统(Linux/Windows/macOS)支持,拥有全面数据采集能力,涵盖主机、容器、中间件、Tracing、日志以及安全巡检等各种场景。

主要功能

说明

实验性功能

DataKit 发布的时候,会带上一些实验性功能,这些功能往往是初次发布的新功能,这些功能的实现,可能会有一些欠缺考虑或不严谨的地方,故使用实验性功能的时候,需考虑如下一些可能的情况:

  • 功能不太稳定
  • 于一些功能配置,在后续的迭代过程中,不保证其兼容性
  • 由于其局限性,功能可能会被移除,但会有对应的其它措施来满足对应的需求

对于这部分功能,请大家慎重使用。

在使用实验性功能的过程中,相关问题可以提交到 issue 中:

图例说明

图例 说明
表示该采集器支持选举
例分别用来表示 Linux、Windows、macOS、 Kubernetes 以及 Docker
表示实验性功能(参见实验性功能的描述

注意事项

在使用 Datakit 过程中,对已有的系统可能会有如下一些影响:

  1. 日志采集会导致的磁盘高速读取,日志量越大,读取的 iops 越高
  2. 如果在 Web/App 应用中加入了 RUM SDK,那么会有持续的 RUM 相关的数据上传,如果上传的带宽有相关限制,可能会导致 Web/App 的页面卡顿
  3. eBPF 开启后,由于采集的数据量比较大,会占用一定量的内存和 CPU。其中 bpf-netlog 开启后,会根据主机和容器网卡的所有 TCP 数据包,产生大量的日志
  4. 在 Datakit 繁忙的时候(接入了大量的日志/Trace 以及外部数据导入等),其会占用相当量的 CPU 和内存资源,建议设置合理的 cgroup 来加以控制
  5. 当 Datakit 部署在 Kubernetes 中时,对 API server 会有一定的请求压力

文档评价

文档内容是否对您有帮助? ×