[项目更新] Dunetrace:实时监控您的生产环境 AI Agent
摘要
Dunetrace 是一款专为生产环境 AI Agent 设计的开源实时监控工具。此次更新增加了跨 Agent 模式分析、与 Langfuse 的深度分析集成,以及对自定义 Agent 的支持。
我一直在开发 Dunetrace,这是一个面向生产环境 Agent 的开源实时监控工具。最新版本新增了以下功能:**跨 Agent 模式分析**。Dunetrace 现在不仅能显示每次运行的警报,还能展示在整个 Agent 舰队中触发的检测器情况。例如,本周 18% 的 example-agent 运行中触发了 TOOL_LOOP 且呈上升趋势?这表明存在代码缺陷,而非偶发性故障。按 agent_id 为每个 Agent 计算 0-100 的健康评分。**Langfuse 深度分析**。连接您的 Langfuse API 密钥后,每个信号上都会出现一个“通过 Langfuse 解释”按钮。Dunetrace 会获取追踪数据,读取实际的系统提示词(system prompt),并准确告知缺失了什么。您可以通过真实证据找到根本原因。**自定义 TypeScript 和 Python Agent 集成**。部分开发者在 LangChain 之外构建自定义 Agent,现在已提供零依赖的集成方案。如果有遗漏之处,请告诉我。如果您觉得该项目有用,欢迎在 GitHub 上点赞(⭐)。谢谢!
相似文章
构建了一个广播仪表盘,监测来自21个主要来源的AI代理发展动态——这是我正在追踪的内容以及缺失的部分
一位用户描述构建了一个广播仪表盘,追踪来自arXiv、GitHub和Hugging Face等21个来源的AI代理发展动态,指出了覆盖的强项和不足。
Tracea
Tracea 是一款新产品,为AI代理提供类似Datadog的可观测性,具备追踪、根本原因分析和团队记忆等功能。
监控和审计自主AI代理运行时行为的最佳工具:生产环境中哪些真正有效?
一位从业者分享了在生产环境中监控自主AI代理的挑战和工具,涵盖了运行时提示注入检测、带推理轨迹的工具调用审计、行为漂移检测以及多代理授权,同时测试了Arize Phoenix、Protect AI Guardian、Metoro、Alice、Asqav和Microsoft Agent Governance Toolkit等工具。
@JiaZhihao: 推出 Motus Tracing:AI 代理的开源可观测性。没有追踪,代理就是消耗 token 的黑盒……
Motus Tracing 是一个完全开源的可观测层,专为 AI 代理设计,能够捕获每一次模型调用、工具调用、沙箱交互和错误,提供统一的跨度模型,支持本地开发和云部署,零设置成本。
构建AI代理时如何进行评估与可观测性?
作者探讨了在生产环境中评估和监控AI代理所面临的挑战,包括离线评估与在线评估、LLM作为评判、链路追踪和成本追踪,并提到Langfuse、LangSmith等工具,但更关注底层流程。