可观测性是多Agent系统的刹车片:我用OpenTelemetry给LangGraph装上追踪,采购审批从“盲开”变透明

我们为LangGraph多Agent系统搭建了一套OpenTelemetry追踪方案,通过自定义Span记录每个Agent的推理过程、LLM调用耗时和中间决策,彻底解决了审批链路断裂和性能瓶颈的排查难题。文章包含异步上下文传递的坑、自动埋点LLM调用的代码,以及用Span属性构建的业务告警系统,最终把人工兜底率从7%降到0.5%。