应用性能监测¶
应用性能监测支持使用 Opentracing 协议的采集器,实现对分布式架构的应用进行端到端的链路分析,并与基础设施、日志、用户访问监测进行关联,快速定位并解决故障,提高用户体验。
部署架构¶
最佳部署方案是将 DataKit 部署在每一台应用服务器中,通过服务所在主机的 DataKit 后将数据打到观测云中心,能更好地对应用服务的服务器主机指标、应用日志、系统日志、应用服务链路数据等统一汇聚,进行各项数据的关联分析。
应用场景¶
- 大规模分布式应用的高效管理:通过服务清单,您可以实时查看不同服务的所有权、依赖关系、性能指标,快速发现和解决服务的性能问题;
- 端到端的分布式链路分析:通过火焰图,您可以轻松观测整条链路中每个 Span 的流转和执行效率;
- 数据关联分析:通过丰富的标签功能自动关联基础设施、日志、用户访问监测等数据进行分析;
- 方法级的代码性能追踪:通过采集 Profile 数据,获取链路相关 Span 的关联代码执行片段,直观展示性能瓶颈,帮助开发人员发现代码优化方向。
功能介绍¶
- 服务、服务拓扑图及服务清单:支持查看服务的关键性能指标、服务的调用关系拓扑图以及不同服务的团队所有权,实时查看服务性能指标及其依赖关系、关联数据,及时发现和解决服务瓶颈;
- 概览:支持查看在线服务数量、P90 服务响应耗时、服务最大影响耗时、服务错误数、服务错误率统计,以及 P90 服务、资源、操作的响应耗时 Top10 排行,服务错误率、资源 5xx 错误率、资源 4xx 错误率 Top10 排行;
- 链路查看器:支持对采集上报的所有链路数据进行查询和分析,通过火焰图,直观的查看链路中每个 Span 的上下文情况及执行效率,通过不同数据的关联分析,帮助快速定位性能问题;
- 错误追踪:支持查看链路中类似错误的产生历史趋势及其分布情况,帮助快速定位错误问题;
- Profile:支持查看应用程序运行过程中 CPU、内存和 I/O 的使用情况,通过火焰图实时展示每一个方法、类和线程的调用关系和执行效率,帮助优化代码性能;
- 应用性能指标检测:支持通过配置应用性能监控器,及时发现异常链路。
数据存储策略¶
观测云为应用性能数据提供 3 天、7 天、14 天三种数据存储时长选择,您可以按照需求在管理 > 基本设置 > 变更数据存储策略中调整。更多数据存储策略可参考文档 数据存储策略。
数据计费规则¶
观测云支持按需购买,按量付费的计费方式。应用性能监测计费统计当前空间下,trace_id 的数量,采用梯度计费模式,更多计费规则可参考文档 计费方式。