采集器「OB Cloud-云监控」配置手册¶
阅读本文前,请先阅读:
Tip
使用本采集器前,必须安装「Integration Core」及其配套的第三方依赖包
Tip
该采集器默认支持开启多线程(默认开启五个线程),如果需要更改线程池大小,可以设置环境变量 COLLECTOR_THREAD_POOL_SIZE
1. 配置结构¶
本采集器配置结构如下:
| 字段 | 类型 | 是否必须 | 说明 |
|---|---|---|---|
targets |
list | 必须 | 云监控采集对象配置列表 相同命名空间的多个配置之间逻辑关系为「且」 |
targets[#].labels |
str | 必须 | 所需采集的纬度。如:'clusterId,tenantId' 参考指标概览 |
targets[#].metrics |
list | 必须 | 所需采集的云监控指标名列表 参考指标概览 |
targets[#].metrics[#] |
str | 必须 | 指标名模式,支持"NOT"、通配符方式匹配正常情况下,多个之间逻辑关系为「或」 包含 "NOT"标记时,多个之间逻辑关系为「且」。详见下文 |
2. 配置示例¶
指定特定指标¶
采集 ECS 中名称为active_session、all_session的 2 个指标
collector_configs = {
'targets': [
{
'labels': 'clusterId,tenantId',
'metrics' : ['active_session', 'all_session',],
},
],
}
通配符匹配指标¶
指标名可以使用*通配符来匹配。
本例中以下指标会被采集:
- 名称为
all_session的指标 - 名称以
active开头的指标 - 名称以
session结尾的指标 - 名称中包含
session的指标
collector_configs = {
'targets': [
{
'labels': 'clusterId,tenantId',
'metrics' : ['all_session', 'active*', '*session', '*session*'],
},
],
}
剔除部分指标¶
在开头添加"NOT"标记表示去除后面的指标。
本例中,以下指标 [不会] 被采集:
- 名称为
all_session的指标 - 名称以
active开头的指标 - 名称以
session结尾的指标 - 名称中包含
session的指标
collector_configs = {
'targets': [
{
'labels': 'clusterId,tenantId',
'metrics' : ['NOT', 'all_session', 'active*', '*session', '*session*'],
},
],
}
多重过滤指定所需指标¶
相同的命名空间可以指定多次,从上到下依次按照指标名进行过滤。
本例中,相当于对指标名进行了如下过滤步骤:
- 选择所有名称中包含
session的指标 - 在上一步结果中,去除名称为
all_session的指标
collector_configs = {
'targets': [
{
'labels': 'clusterId,tenantId',
'metrics' : ['*session*'],
},
{
'labels': 'clusterId,tenantId',
'metrics' : ['NOT', 'all_session'],
},
],
}
3. 数据上报格式¶
数据正常同步后,可以在 观测云 的「指标」中查看数据。
以如下采集器配置为例:
collector_configs = {
'targets': [
{
'labels': 'clusterId,tenantId',
'metrics' : ['active_session'],
},
],
}
上报的数据示例如下:
{
"measurement": "obcloud_oceanbase_metric",
"fields": {
"active_session": 1.0
},
"tags": {
"cloud_provider": "obcloud",
"cluster_id": "xxxxxx",
"cluster_name": "xxxxxx",
"cluster_role": "NORMAL",
"cluster_type": "cluster",
"labels": "clusterId,tenantId",
"project_id": "xxxxxx",
"tenant_id": "xxxxxx",
"tenant_name": "xxxxxx"
},
"timestamp": 1766000000
}
Tip
所有的指标值都会以 float 类型上报
4、指标概览¶
clusterId:集群实例clusterId,serverId:集群主机-节点clusterId,zoneId:集群副本
| metricName | labels | description | unit |
|---|---|---|---|
| sql_all_count | clusterIdclusterId,serverIdclusterId,zoneId |
每秒处理 SQL 语句数 | count |
| sql_all_rt | clusterIdclusterId,serverIdclusterId,zoneId |
SQL 语句平均处理耗时 | ms |
| io_count | clusterIdclusterId,serverIdclusterId,zoneId |
SSStore 每秒 IO 次数 | count |
| io_rt | clusterIdclusterId,serverIdclusterId,zoneId |
IO 耗时 | µs |
| io_size | clusterIdclusterId,serverIdclusterId,zoneId |
SSStore 每秒处理数据量 | B |
| ob_waitevent_count | clusterIdclusterId,serverIdclusterId,zoneId |
等待事件数 | count |
| ob_sql_event | clusterIdclusterId,serverIdclusterId,zoneId |
数据库处于某状态的执行事件数 | count |
| all_session | clusterIdclusterId,serverIdclusterId,zoneId |
当前会话数 | count |
| transaction_count | clusterIdclusterId,serverIdclusterId,zoneId |
TPS | count |
| transaction_rt | clusterIdclusterId,serverIdclusterId,zoneId |
事务响应时间 | ms |
| request_queue_time | clusterIdclusterId,serverIdclusterId,zoneId |
请求等待队列耗时 | µs |
| trans_commit_log_count | clusterIdclusterId,serverIdclusterId,zoneId |
每秒提交的事务日志数 | count |
| clog_trans_log_total_size | clusterIdclusterId,serverIdclusterId,zoneId |
每秒提交的事务日志大小 | B |
| transaction_partition_count | clusterIdclusterId,serverIdclusterId,zoneId |
每秒事务数 | count |
| trans_commit_log_sync_rt | clusterIdclusterId,serverIdclusterId,zoneId |
事务日志网络同步耗时 | ms |
| ob_worktime | clusterIdclusterId,serverIdclusterId,zoneId |
数据库工作时间 | s |
| ob_no_idle_waiting_time | clusterIdclusterId,serverIdclusterId,zoneId |
数据库非空闲等待时间 | s |
| ob_tenant_log_disk_total_bytes | clusterIdclusterId,serverIdclusterId,zoneId |
日志盘总量 | GB |
| ob_tenant_log_disk_used_bytes | clusterIdclusterId,serverIdclusterId,zoneId |
日志盘使用量 | GB |
| ob_tenant_server_required_size | clusterIdclusterId,serverIdclusterId,zoneId |
数据占用量 | GB |
| ob_tenant_server_data_size | clusterIdclusterId,serverIdclusterId,zoneId |
数据量 | GB |
| ob_tenant_binlog_disk_used | clusterIdclusterId,serverIdclusterId,zoneId |
Binlog 日志磁盘使用量 | GB |
| uptime | clusterIdclusterId,serverIdclusterId,zoneId |
可用时间 | s |
| load1 | clusterId,serverId |
过去 1 分钟系统平均负载 | N/A |
| cpu_percent | clusterId,serverId |
CPU 使用率 | percent |
| memory_percent | clusterId,serverId |
内存使用率 | percent |
| net_throughput | clusterId,serverId |
网络吞吐量 | MB |
| net_recv | clusterId,serverId |
每秒接收数据量 | MB |
| net_send | clusterId,serverId |
每秒发送数据量 | MB |
| ob_data_disk_used_size | clusterId,serverId |
磁盘使用量 | GB |
| ob_data_disk_percent | clusterId,serverId |
OB 数据盘使用率 | percent |
| ob_clog_disk_percent | clusterId,serverId |
OB 日志盘使用率 | percent |
| ob_data_required_size | clusterId,serverId |
数据占用量 | GB |
| ob_clog_io | clusterId,serverId |
OB 日志盘平均每秒 IO 次数 | count |
| ob_clog_io_time | clusterId,serverId |
OB 日志盘平均每次 IO 耗时 | ms |
| ob_clog_io_byte | clusterId,serverId |
OB 日志盘平均每秒 IO 数据量 | MB |
| ob_clog_io_util | clusterId,serverId |
OB 日志盘 IO 繁忙比率 | percent |
| ob_data_io | clusterId,serverId |
OB 数据盘平均每秒 IO 次数 | count |
| ob_data_io_time | clusterId,serverId |
OB 数据盘平均每次 IO 耗时 | ms |
| ob_data_io_byte | clusterId,serverId |
OB 数据盘平均每秒 IO 数据量 | MB |
| ob_data_io_util | clusterId,serverId |
OB 数据盘 IO 繁忙比率 | percent |
| ob_host_real_time_iops | clusterId,serverId |
OB 主机实时 IOPS | iops |
| ob_host_real_time_throughput | clusterId,serverId |
OB 主机实时吞吐量 | MB/S |
| ob_host_iops_used_percent | clusterId,serverId |
OB 主机 IO 使用率 | percent |
| ob_host_throughput_used_percent | clusterId,serverId |
OB 主机吞吐量使用率 | percent |
| ntp_offset_milliseconds | clusterId,serverId |
ntp 时钟偏移 | ms |
| ob_process_exists | clusterId,serverId |
OB 进程存活状态 | N/A |
clusterId,tenantId:租户clusterId,tenantId,serverId:租户主机-节点
| metricName | labels | description | Unit |
|---|---|---|---|
| sql_all_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 SQL 语句数 | count |
| sql_all_rt | clusterId,tenantIdclusterId,tenantId,serverId |
SQL 语句平均处理耗时 | ms |
| io_count | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每秒 IO 次数 | count |
| io_rt | clusterId,tenantIdclusterId,tenantId,serverId |
IO 耗时 | µs |
| io_size | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每秒处理数据量 | B |
| ob_waitevent_count | clusterId,tenantIdclusterId,tenantId,serverId |
等待事件数 | count |
| ob_sql_event | clusterId,tenantIdclusterId,tenantId,serverId |
数据库处于某状态的执行事件数 | count |
| all_session | clusterId,tenantIdclusterId,tenantId,serverId |
当前会话数 | count |
| transaction_count | clusterId,tenantIdclusterId,tenantId,serverId |
TPS | count |
| transaction_rt | clusterId,tenantIdclusterId,tenantId,serverId |
事务响应时间 | ms |
| request_queue_time | clusterId,tenantIdclusterId,tenantId,serverId |
请求等待队列耗时 | µs |
| trans_commit_log_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒提交的事务日志数 | count |
| clog_trans_log_total_size | clusterId,tenantIdclusterId,tenantId,serverId |
每秒提交的事务日志大小 | B |
| transaction_partition_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒事务数 | count |
| trans_commit_log_sync_rt | clusterId,tenantIdclusterId,tenantId,serverId |
事务日志网络同步耗时 | ms |
| ob_worktime | clusterId,tenantIdclusterId,tenantId,serverId |
数据库工作时间 | s |
| ob_no_idle_waiting_time | clusterId,tenantIdclusterId,tenantId,serverId |
数据库非空闲等待时间 | s |
| ob_tenant_log_disk_total_bytes | clusterId,tenantIdclusterId,tenantId,serverId |
日志盘总量 | GB |
| ob_tenant_log_disk_used_bytes | clusterId,tenantIdclusterId,tenantId,serverId |
日志盘使用量 | GB |
| ob_tenant_server_required_size | clusterId,tenantIdclusterId,tenantId,serverId |
数据占用量 | GB |
| ob_tenant_server_data_size | clusterId,tenantIdclusterId,tenantId,serverId |
数据量 | GB |
| ob_tenant_binlog_disk_used | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 日志磁盘使用量 | GB |
| uptime | clusterId,tenantIdclusterId,tenantId,serverId |
可用时间 | s |
| active_session | clusterId,tenantIdclusterId,tenantId,serverId |
当前活跃会话数 count | count |
| sql_all_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 SQL 语句数 | count |
| sql_delete_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 Delete 语句数 | count |
| sql_insert_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 Insert 语句数 | count |
| sql_other_count | clusterId,tenantIdclusterId,tenantId,serverId |
DDL, DCL, DTL 等其他语句数 | count |
| sql_replace_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 Replace 语句数 | count |
| sql_select_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 Select 语句数 | count |
| sql_update_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理 Update 语句数 | count |
| sql_delete_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Delete 语句平均处理耗时 | ms |
| sql_insert_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Insert 语句平均处理耗时 | ms |
| sql_other_rt | clusterId,tenantIdclusterId,tenantId,serverId |
DDL, DCL, DTL 等其他语句平均处理耗时 | ms |
| sql_replace_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Replace 语句平均处理耗时 | ms |
| sql_select_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Select 语句平均处理耗时 | ms |
| sql_update_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Update 语句平均处理耗时 | ms |
| sql_all_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句平均处理耗时 | ms |
| sql_delete_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句 delete 平均处理耗时 | ms |
| sql_insert_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句 insert 平均处理耗时 | ms |
| sql_other_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句 other 平均处理耗时 | ms |
| sql_replace_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句 replace 平均处理耗时 | ms |
| sql_select_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句 select 平均处理耗时 | ms |
| sql_update_rt_p99 | clusterId,tenantIdclusterId,tenantId,serverId |
99 分位 SQL 语句 update 平均处理耗时 | ms |
| sql_all_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句平均处理耗时 | ms |
| sql_delete_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句 delete 平均处理耗时 | ms |
| sql_insert_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句 insert 平均处理耗时 | ms |
| sql_other_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句 other 平均处理耗时 | ms |
| sql_replace_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句 replace 平均处理耗时 | ms |
| sql_select_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句 select 平均处理耗时 | ms |
| sql_update_rt_p95 | clusterId,tenantIdclusterId,tenantId,serverId |
95 分位 SQL 语句 update 平均处理耗时 | ms |
| sql_all_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句平均处理耗时 | ms |
| sql_delete_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句 delete 平均处理耗时 | ms |
| sql_insert_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句 insert 平均处理耗时 | ms |
| sql_other_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句 other 平均处理耗时 | ms |
| sql_replace_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句 replace 平均处理耗时 | ms |
| sql_select_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句 select 平均处理耗时 | ms |
| sql_update_rt_p90 | clusterId,tenantIdclusterId,tenantId,serverId |
90 分位 SQL 语句 update 平均处理耗时 | ms |
| sql_distributed_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理分布式执行计划数 | count |
| sql_local_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理本地执行数 | count |
| sql_remote_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒处理远程执行计划数 | count |
| ob_sql_event_in_parse | clusterId,tenantIdclusterId,tenantId,serverId |
处于 parse 状态的执行事件数 | count |
| ob_sql_event_in_pl_parse | clusterId,tenantIdclusterId,tenantId,serverId |
处于 pl parse 状态的执行事件数 | count |
| ob_sql_event_in_plan_cache | clusterId,tenantIdclusterId,tenantId,serverId |
处于 plan cache 状态的执行事件数 | count |
| ob_sql_event_in_sql_optimize | clusterId,tenantIdclusterId,tenantId,serverId |
处于 sql optimize 状态的执行事件数 | count |
| ob_sql_event_in_sql_execution | clusterId,tenantIdclusterId,tenantId,serverId |
处于 sql execution 状态的执行事件数 | count |
| ob_sql_event_in_px_execution | clusterId,tenantIdclusterId,tenantId,serverId |
处于 px execution 状态的执行事件数 | count |
| ob_sql_event_in_sequence_load | clusterId,tenantIdclusterId,tenantId,serverId |
处于 sequence load 状态的执行事件数 | count |
| wait_event_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒等待事件次数 | count |
| system_event_other_count | clusterId,tenantIdclusterId,tenantId,serverId |
other 等待事件数 | count |
| system_event_application_count | clusterId,tenantIdclusterId,tenantId,serverId |
application 等待事件数 | count |
| system_event_configuration_count | clusterId,tenantIdclusterId,tenantId,serverId |
configuration 等待事件数 | count |
| system_event_administrative_count | clusterId,tenantIdclusterId,tenantId,serverId |
administrative 等待事件数 | count |
| system_event_concurrency_count | clusterId,tenantIdclusterId,tenantId,serverId |
concurrency 等待事件数 | count |
| system_event_commit_count | clusterId,tenantIdclusterId,tenantId,serverId |
commit 等待事件数 | count |
| system_event_idle_count | clusterId,tenantIdclusterId,tenantId,serverId |
idle 等待事件数 | count |
| system_event_network_count | clusterId,tenantIdclusterId,tenantId,serverId |
network 等待事件数 | count |
| system_event_user_io_count | clusterId,tenantIdclusterId,tenantId,serverId |
user_io 等待事件数 | count |
| system_event_system_io_count | clusterId,tenantIdclusterId,tenantId,serverId |
system_io 等待事件数 | count |
| system_event_scheduler_count | clusterId,tenantIdclusterId,tenantId,serverId |
scheduler 等待事件数 | count |
| system_event_cluster_count | clusterId,tenantIdclusterId,tenantId,serverId |
cluster 等待事件数 | count |
| wait_event_rt | clusterId,tenantIdclusterId,tenantId,serverId |
等待事件平均耗时 | µs |
| system_event_other_time_waites | clusterId,tenantIdclusterId,tenantId,serverId |
other 等待事件平均耗时 | µs |
| system_event_application_time_waites | clusterId,tenantIdclusterId,tenantId,serverId |
application 等待事件平均耗时 | µs |
| system_event_configuration_time_waites | clusterId,tenantIdclusterId,tenantId,serverId |
configuration 等待事件平均耗时 | µs |
| system_event_administrative_time_waites | clusterId,tenantIdclusterId,tenantId,serverId |
administrative 等待事件平均耗时 | µs |
| system_event_concurrency_waites | clusterId,tenantIdclusterId,tenantId,serverId |
concurrency 等待事件平均耗时 | µs |
| system_event_commit_waites | clusterId,tenantIdclusterId,tenantId,serverId |
commit 等待事件平均耗时 | µs |
| system_event_idle_waites | clusterId,tenantIdclusterId,tenantId,serverId |
idle 等待事件平均耗时 | µs |
| system_event_network_waites | clusterId,tenantIdclusterId,tenantId,serverId |
network 等待事件平均耗时 | µs |
| system_event_user_io_waites | clusterId,tenantIdclusterId,tenantId,serverId |
user_io 等待事件平均耗时 | µs |
| system_event_system_io_waites | clusterId,tenantIdclusterId,tenantId,serverId |
system_io 等待事件平均耗时 | µs |
| system_event_scheduler_waites | clusterId,tenantIdclusterId,tenantId,serverId |
scheduler 等待事件平均耗时 | µs |
| system_event_cluster_waites | clusterId,tenantIdclusterId,tenantId,serverId |
cluster 等待事件平均耗时 | µs |
| request_dequeue_count | clusterId,tenantIdclusterId,tenantId,serverId |
从处理队列出队的请求数量 | count |
| request_enqueue_count | clusterId,tenantIdclusterId,tenantId,serverId |
进入处理队列的请求数量 | count |
| ob_foreground_waitevent_count | clusterId,tenantIdclusterId,tenantId,serverId |
数据库前台处于某个状态的等待事件数 | count |
| ob_background_waitevent_count | clusterId,tenantIdclusterId,tenantId,serverId |
数据库后台处于某个状态的等待事件数 | count |
| ob_cpu_percent | clusterId,tenantIdclusterId,tenantId,serverId |
租户线程 CPU 使用率 | percent |
| memstore_percent | clusterId,tenantIdclusterId,tenantId,serverId |
MEMStore 使用百分比 | percent |
| opened_cursors_count | clusterId,tenantIdclusterId,tenantId,serverId |
打开的游标数 | count |
| slow_sql_count | clusterId,tenantIdclusterId,tenantId,serverId |
慢 sql 数量 | count |
| rpc_packet_in_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Rpc 收包平均耗时 | µs |
| rpc_packet_out_rt | clusterId,tenantIdclusterId,tenantId,serverId |
Rpc 发包平均耗时 | µs |
| rpc_packet_in | clusterId,tenantIdclusterId,tenantId,serverId |
Rpc 收包吞吐量 | B |
| rpc_packet_out | clusterId,tenantIdclusterId,tenantId,serverId |
Rpc 发包吞吐 | B |
| ob_foreground_worktime | clusterId,tenantIdclusterId,tenantId,serverId |
数据库前台工作时间 | s |
| ob_background_worktime | clusterId,tenantIdclusterId,tenantId,serverId |
数据库后台工作时间 | s |
| ob_foreground_no_idle_waiting_time | clusterId,tenantIdclusterId,tenantId,serverId |
数据库前台非空闲等待时间 | s |
| ob_background_no_idle_waiting_time | clusterId,tenantIdclusterId,tenantId,serverId |
数据库后台非空闲等待时间 | s |
| ob_clog_ls_max_replayed_scn | clusterId,tenantIdclusterId,tenantId,serverId |
副本延迟 | s |
| transaction_commit_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒提交事务数 | count |
| transaction_rollback_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒回滚事务数 | count |
| transaction_timeout_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒超时事务数 | count |
| transaction_commit_rt | clusterId,tenantIdclusterId,tenantId,serverId |
事务平均提交耗时 | ms |
| transaction_rollback_rt | clusterId,tenantIdclusterId,tenantId,serverId |
事务平均回滚耗时 | ms |
| memstore_write_lock_fail_count | clusterId,tenantIdclusterId,tenantId,serverId |
写锁等待失败次数 | count |
| memstore_write_lock_succ_count | clusterId,tenantIdclusterId,tenantId,serverId |
写锁等待成功次数 | count |
| memstore_write_lock_wait_time | clusterId,tenantIdclusterId,tenantId,serverId |
写锁平均等待耗时 | µs |
| transaction_multi_partition_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒分布式事务数 | count |
| transaction_single_partition_count | clusterId,tenantIdclusterId,tenantId,serverId |
每秒普通事务数 | count |
| io_read_count | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每秒读次数 | count |
| io_write_count | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每秒写次数 | count |
| io_read_rt | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每次读取平均耗时 | µs |
| io_write_rt | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每次写入平均耗时 | µs |
| io_read_size | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每秒读取数据量 | B |
| io_write_size | clusterId,tenantIdclusterId,tenantId,serverId |
SSStore 每秒写入数据量 | B |
| active_memstore_used | clusterId,tenantIdclusterId,tenantId,serverId |
活跃 MEMStore 大小 | MB |
| major_freeze_trigger | clusterId,tenantIdclusterId,tenantId,serverId |
触发合并阈值 | MB |
| memstore_limit | clusterId,tenantIdclusterId,tenantId,serverId |
MEMStore 的 limit | MB |
| total_memstore_used | clusterId,tenantIdclusterId,tenantId,serverId |
MEMStore 总大小 | MB |
| ob_tenant_memory_percent | clusterId,tenantIdclusterId,tenantId,serverId |
OB 租户内存使用率 | percent |
| block_cache_size | clusterId,tenantIdclusterId,tenantId,serverId |
块缓存大小 | MB |
| bloom_filter_cache_size | clusterId,tenantIdclusterId,tenantId,serverId |
bloom filter 缓存大小 | MB |
| clog_cache_size | clusterId,tenantIdclusterId,tenantId,serverId |
Clog 缓存大小 | MB |
| plan_cache_size | clusterId,tenantIdclusterId,tenantId,serverId |
执行计划缓存大小 | MB |
| row_cache_size | clusterId,tenantIdclusterId,tenantId,serverId |
行缓存大小 | MB |
| block_cache_hit_ratio | clusterId,tenantIdclusterId,tenantId,serverId |
块缓存命中率 | percent |
| bloom_filter_cache_hit_ratio | clusterId,tenantIdclusterId,tenantId,serverId |
bloom filter 缓存命中率 | percent |
| clog_cache_hit_ratio | clusterId,tenantIdclusterId,tenantId,serverId |
Clog 缓存命中率 | percent |
| location_cache_hit_ratio | clusterId,tenantIdclusterId,tenantId,serverId |
location 缓存命中率 | percent |
| plan_cache_hit_ratio | clusterId,tenantIdclusterId,tenantId,serverId |
执行计划缓存命中率 | percent |
| row_cache_hit_ratio | clusterId,tenantIdclusterId,tenantId,serverId |
行缓存命中率 | percent |
| block_cache_req_total | clusterId,tenantIdclusterId,tenantId,serverId |
块缓存请求次数 | count |
| bloom_filter_cache_req_total | clusterId,tenantIdclusterId,tenantId,serverId |
bloom filter 缓存请求次数 | count |
| clog_cache_req_total | clusterId,tenantIdclusterId,tenantId,serverId |
Clog 缓存请求次数 | count |
| location_cache_req_total | clusterId,tenantIdclusterId,tenantId,serverId |
location 缓存请求次数 | count |
| row_cache_req_total | clusterId,tenantIdclusterId,tenantId,serverId |
行缓存请求次数 | count |
| binlog_instance_convert_delay | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 转换延迟 | ms |
| binlog_instance_convert_iops | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 转换 IOPS | MB |
| binlog_instance_convert_fetch_rps | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 转换 RPS | reqps |
| binlog_instance_convert_storage_rps | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 落盘 RPS | reqps |
| ob_tenant_binlog_disk_used | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 日志磁盘使用量 | GB |
| binlog_instance_dump_delay | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 发送延迟 Top5 | s |
| binlog_instance_dump_iops | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 网络流量 Top5 | MB |
| binlog_instance_dump_rps | clusterId,tenantIdclusterId,tenantId,serverId |
Binlog 发送 RPS Top5 | reqps |
proxyClusterId,tenantId:数据库代理-租户proxyClusterId,proxyServerId:数据库代理主机-节点
| netricName | labels | description | unit |
|---|---|---|---|
| client_connections | proxyClusterId,tenantId |
客户端连接数 | count |
| server_connections | proxyClusterId,tenantId |
服务端连接数 | count |
| qps | proxyClusterId,tenantId |
每秒处理 SQL 语句数 | count |
| qps_rt | proxyClusterId,tenantId |
SQL 语句平均处理耗时 | ms |
| tps | proxyClusterId,tenantId |
TPS | count |
| load1 | proxyClusterId,proxyServerId |
过去 1 分钟系统平均负载 | count |
| cpu_percent | proxyClusterId,proxyServerId |
CPU 使用率 | ms |
| memory_buffers | proxyClusterId,proxyServerId |
内核 Buffer Cache 大小 | GB |
| memory_free | proxyClusterId,proxyServerId |
可用物理内存大小 | GB |
| io_read | proxyClusterId,proxyServerId |
每秒读次数 | count |
| io_write | proxyClusterId,proxyServerId |
每秒写次数 | count |
| net_recv | proxyClusterId,proxyServerId |
每秒接收数据量 | MB |
| net_send | proxyClusterId,proxyServerId |
每秒发送数据量 | MB |
Tip
指标参考 OB Cloud 控制台集群、租户性能监控视图
X. 附录¶
请参考 OB Cloud 官方文档: