分析看板¶
在 Agent 监测 > 分析看板,您可以以图表的形式查看选定应用下的多个指标信息,全面掌握应用性能与成本分布。页面顶部支持按应用筛选。
注意
当筛选时间段内无数据时,图表区域将显示“暂无数据”状态。您可以通过右上角时间控件调整查看范围。
LLM 监测应用¶
选择 LLM 监测应用后,分析看板展示以下内容。
核心指标概览¶
看板顶部展示选定时间范围内的关键指标统计:
- 请求数量:总请求次数统计
- Span 数量:关联的 Span 调用总数
- 请求错误率:失败请求占总请求的百分比
- Token 总消耗:所有请求消耗的 Token 总量
- 平均响应耗时:所有请求的平均处理时间
趋势分析图表¶
通过多维度趋势图表,您可以追踪应用性能与使用趋势的变化:
- 请求趋势图:查看不同时段的请求量分布,识别使用高峰
- 请求错误率:展示错误率变化趋势,快速发现异常波动
- 请求响应时间:展示 Avg、P75、P90、P99 分位耗时,定位长尾延迟问题
- Token 消耗趋势图:展示 Token 使用量的时间分布,辅助成本预测
- 首个令牌的平均响应时间(TTFT):衡量首字延迟,反映模型响应速度
模型与用户分析¶
从模型维度和用户维度分析资源使用与性能表现:
- 各模型请求数占比:环形图展示不同模型的调用分布(如 qwen3:1.7b)
- 各模型的 Token 使用量排行:对比不同模型的资源消耗
- 各模型请求响应分析(Top 20):表格展示各模型的请求数、平均/最大耗时、分位耗时等详细性能指标
- 用户请求数排行(Top 10):识别高频使用用户
- 用户 Token 消耗排行(Top 10):定位高成本用户,辅助成本分摊
Agent 监测应用¶
选择 Agent 监测应用后,分析看板按 请求、模型、Skill、Tool 四个模块展示。
请求模块¶
- 平均请求时长:不同 Agent 在一段时间范围内的时延波动
- 请求总数趋势:不同 Agent 在一段时间范围内的 request 总数趋势 点击某一点或框选某一时间段,可将时间带入跳转至对应 Agent 查看详情。
模型模块¶
- 模型使用排行:查看各模型的调用热度
- 模型平均请求时长:比较不同模型的响应时延趋势,快速看出性能优劣
- 模型 Token 消耗排行:查看模型的 Token 消耗排行,帮助明确成本
Skill 模块¶
- Skill 使用排行:查看 Skill 的使用热度,便于优化调用策略
- Skill 平均请求时长:对比不同 Skill 的执行波动
Tool 模块¶
- Tool 调用排行:查看各 Tool 的调用次数排名
- Tool 调用平均时长:统计各 Tool 的平均执行耗时
- Tool 调用最大时长:统计各 Tool 的最大执行耗时
- Tool 调用最小时长:统计各 Tool 的最小执行耗时
更多阅读¶
您可能对以下内容感兴趣:
