采集器「华为云-云监控」配置手册¶

阅读本文前，请先阅读：

云集成

Tip

使用本采集器前，必须安装「Integration Core」及其配套的第三方依赖包

Tip

该采集器默认支持开启多线程（默认开启五个线程），如果需要更改线程池大小，可以设置环境变量 COLLECTOR_THREAD_POOL_SIZE

1. 配置结构¶

本采集器配置结构如下：

字段	类型	是否必须	说明
`regions`	list	必须	所需采集的地域列表
`regions[#]`	str	必须	地域 ID。如：`'cn-north-4'` 总表见附录
`targets`	list	必须	云监控采集对象配置列表相同命名空间的多个配置之间逻辑关系为「且」
`targets[#].namespace`	str	必须	所需采集的云监控命名空间。如：`SYS.OBS` 总表见附录
`targets[#].metrics`	list	必须	所需采集的云服务下的指标名列表
`targets[#].metrics[#]`	str	必须	指标名模式，支持`"ALL"`、`"NOT"`、通配符方式匹配多个之间逻辑关系为「或」包含`"NOT"`标记时，多个之间逻辑关系为「且」详见下文

Tip

采集器会自动获取地域下的所有 IAM 项目，再根据 IAM 项目获取资源

2. 配置示例¶

指定特定指标¶

采集SYS.OBS中名称为capacity_total、capacity_archive的 2 个指标

huaweicloud_ces_configs = {
    'regions': ['cn-north-4'],
    'targets': [
        {
            'namespace': 'SYS.OBS',
            'metrics'  : ['capacity_total', 'capacity_archive']
        }
    ]
}

通配符匹配指标¶

指标名可以使用*通配符来匹配。

本例中以下指标会被采集：

名称为capacity_total的指标
名称以capacity开头的指标
名称以total结尾的指标
名称中包含capacity的指标

huaweicloud_ces_configs = {
    'regions': ['cn-north-4'],
    'targets': [
        {
            'namespace': 'SYS.OBS',
            'metrics'  : ['capacity_total', 'capacity*', '*total', '*capacity*']
        }
    ]
}

剔除部分指标¶

在开头添加"NOT"标记表示去除后面的指标。

本例中以下指标[不会]被采集：

名称为capacity_total的指标
名称以capacity开头的指标
名称以total结尾的指标
名称中包含capacity的指标

huaweicloud_ces_configs = {
    'regions': ['cn-north-4'],
    'targets': [
        {
            'namespace': 'SYS.OBS',
            'metrics'  : ['NOT', 'capacity_total', 'capacity*', '*total', '*capacity*']
        }
    ]
}

多重过滤指定所需指标¶

相同的命名空间可以指定多次，从上到下依次按照指标名进行过滤。

本例中，相当于对指标名进行了如下过滤步骤：

选择所有名称中包含capacity的指标
在上一步结果中，去除名称为capacity_total的指标

huaweicloud_ces_configs = {
    'regions': ['cn-north-4'],
    'targets': [
        {
            'namespace': 'SYS.OBS',
            'metrics'  : ['*capacity*']
        },
        {
            'namespace': 'SYS.OBS',
            'metrics'  : ['NOT', 'capacity_total']
        }
    ]
}

配置过滤器（可选项）¶

本采集器脚本支持用户自定义过滤器，让用户通过对象属性筛选出目标资源。过滤器函数返回值为 True｜False

True：目标资源需要被采集。
False 目标资源不需要被采集

# 示例：开启过滤器，根据对象的 instance_id 和 name 属性过滤，配置格式如下：
def filter_instance(instance, namespace='A'):
    '''
    采集 namespace 为 A, id 为 xxxx 的指标
    '''
    # return True
    instance_id = instance['tags'].get('id')
    if instance_id in ['xxx']:
        return True
    return False


###### Do not modify the following contents #####
from integration_core__runner import Runner
import integration_huaweicloud_ces__main as main


@DFF.API('HuaweiCloud-Monitor Collection', timeout=3600, fixed_crontab='*/5 * * * *')
def run():
    Runner(main.DataCollector(account, collector_configs, filters=[filter_instance])).run()

Tip

相同 namespace 下配置多个过滤器时同时满足所有过滤器才会上报

3. 数据上报格式¶

数据正常同步后，可以在观测云的「指标」中查看数据。

以如下采集器配置为例：

huaweicloud_ces_configs = {
    'regions': ['cn-north-4'],
    'targets': [
        {
            'namespace': 'SYS.OBS',
            'metrics'  : ['capacity_total']
        }
    ]
}

上报的数据示例如下：

{
  "measurement": "huaweicloud_SYS.OBS",
  "tags": {
    "bucket_name": "i-xxx"
  },
  "fields": {
    "capacity_total_average" : "{...}",
    "capacity_total_max"     : "{...}",
    "capacity_total_min"     : "{...}",
    "capacity_total_sum"     : "{...}",
    "capacity_total_variance": "{...}"
  }
}

Tip

所有的指标值都会以 float 类型上报

Tip

本采集器采集了 SYS.OBS 命名空间 (Namespace) 下 capacity_total 指标数据，详情见数据采集说明表格。

4. 与自定义对象采集器联动¶

当同一个 DataFlux Func 中运行了其他自定义对象采集器（如： OBS ）时，本采集器会根据数据采集说明的维度信息补充字段。例如 OBS 根据云监控数据返回的bucket_name字段尝试匹配自定义对象中的tags.name字段。

由于需要先获知自定义对象信息才能在云监控采集器中进行联动，因此一般建议将云监控的采集器放置在列表末尾，如：

# 创建采集器
collectors = [
    huaweicloud_obs.DataCollector(account, common_huaweicloud_configs), # 自定义对象采集器
    huaweicloud_ces.DataCollector(account, huaweicloud_ces_configs) # 云监控采集器
]

当成功匹配后，会将所匹配的自定义对象 tags 中额外的字段加入到云监控数据的 tags 中，以此实现在使用实例名称筛选云监控的指标数据等效果。具体效果如下：

假设云监控采集到的原始数据如下：

{
  "measurement": "huaweicloud_SYS.OBS",
  "tags": {
    "bucket_name": "i-xxx"
  },
  "fields": { 
    "key": "value"
   }
}

同时，华为云 OBS 采集器采集到的自定义对象数据如下：

{
  "measurement": "huaweicloud_cvm",
  "tags": {
    "name"           : "xxx",
    "bucket_type"    : "xxx",
    "PlatformDetails": "xxx",
    "{...}"          : "{...}"
  },
  "fields": { 
    "key": "value" 
  }
}

那么，最终上报的云监控数据如下：

{
  "measurement": "huaweicloud_SYS.OBS",
  "tags": {
    "name"            : "xxx",
    "bucket_name"     : "xxx", // 云监控原始字段
    "bucket_type"     : "xxx", // 来自自定义对象 OBS 的字段
    "PlatformDetails" : "xxx", // 来自自定义对象 OBS 的字段
    "{...}"
  },
  "fields": { 
    "key": "value"
   }
}

5. 故障排除¶

运行程序时，可能会遇到如下问题报错：

HTTPClientError: An HTTP Client raised an unhandled exception: SoftTimeLimitExceeded()

原因：任务执行时间过长导致超时。

解决方法：

减少采集的指标，明确需求，仅采集自身确实需要的指标
适当加大对启动函数的 timeout 设置，如：

# 设置超时时间为 120 秒
@DFF.API('执行采集', timeout=120)
def run():
    # 具体代码略
    pass

7. 云监控调用次数说明¶

Tip

华为云官方对本脚本内使用到的云监控接口调用次数没有限制，都是免费使用

X. 附录¶

华为云云监控¶

请参考华为云官方文档：