分析看板¶
在 LLM 监测 > 分析看板,您可以以图表的形式查看选定应用下的多个指标信息,包括请求量、错误率、Token 消耗、响应耗时、各模型使用占比等核心指标,全面掌握应用性能与成本分布。
注意
当筛选时间段内无数据时,图表区域将显示“暂无数据”状态。您可以通过右上角时间控件调整查看范围。
核心指标概览¶
看板顶部展示选定时间范围内的关键指标统计:
- 请求数量:总请求次数统计
- Span 数量:关联的 Span 调用总数
- 请求错误率:失败请求占总请求的百分比
- Token 总消耗:所有请求消耗的 Token 总量
- 平均响应耗时:所有请求的平均处理时间
趋势分析图表¶
通过多维度趋势图表,您可以追踪应用性能与使用趋势的变化:
- 请求趋势图:查看不同时段的请求量分布,识别使用高峰
- 请求错误率:展示错误率变化趋势,快速发现异常波动
- 请求响应时间:展示 Avg、P75、P90、P99 分位耗时,定位长尾延迟问题
- Token 消耗趋势图:展示 Token 使用量的时间分布,辅助成本预测
- 首个令牌的平均响应时间(TTFT):衡量首字延迟,反映模型响应速度
模型与用户分析¶
从模型维度和用户维度分析资源使用与性能表现:
- 各模型请求数占比:环形图展示不同模型的调用分布(如 qwen3:1.7b)
- 各模型的 Token 使用量排行:对比不同模型的资源消耗
- 各模型请求响应分析(Top 20):表格展示各模型的请求数、平均/最大耗时、分位耗时等详细性能指标
- 用户请求数排行(Top 10):识别高频使用用户
- 用户 Token 消耗排行(Top 10):定位高成本用户,辅助成本分摊
更多阅读¶
您可能对以下内容感兴趣:
