Pipeline Offload
PlOffload 采集器用于接收来自 DataKit Pipeline Offload 功能卸载的待处理数据。
该采集器将会在 DataKit 开启的 http 服务上注册路由: /v1/write/ploffload/:cagetory
,其中 category
参数可以是 logging
,network
等。主要用于接收数据后异步处理数据,在 Pipeline 脚本处理数据不及时后将数据缓存到磁盘。
配置¶
采集器配置¶
进入 DataKit 安装目录下的 conf.d/ploffload
目录,复制 ploffload.conf.sample
并命名为 ploffload.conf
。示例如下:
[inputs.ploffload]
## Storage config a local storage space in hard dirver to cache data.
## path is the local file path used to cache data.
## capacity is total space size(MB) used to store data.
# [inputs.ploffload.storage]
# path = "./ploffload_storage"
# capacity = 5120
配置好后,重启 DataKit 即可。
Kubernetes 中支持以环境变量的方式修改配置参数:
环境变量名 | 对应的配置参数项 | 参数示例 |
---|---|---|
ENV_INPUT_PLOFFLOAD_STORAGE_PATH |
storage.path |
./ploffload_storage |
ENV_INPUT_PLOFFLOAD_STORAGE_CAPACITY |
storage.capacity |
5120 |
使用方法¶
配置完成后需要将待卸载的数据的 DataKit 的 datakit.yaml
主配置文件中的配置项 pipeline.offload.receiver
的值变更为 ploffload
。
请检查 DataKit 主配置文件的 [http_api]
下的 listen
配置项目的主机地址是否为 0.0.0.0
(或是局域网 IP,广域网 IP),如果是 127.0.0.0/8
,则外部无法访问,需要进行修改。
如果需要开启磁盘缓存功能,需要取消采集器配置中 storage
相关的注释,如修改为: