厌倦了用W&B和Langfuse调试AI代理,所以我自建了一个追踪器,寻求反馈
摘要
构建了一个新的追踪器用于调试AI代理,它能自动检测循环、将会话记录为可读时间线,并支持并排对比。寻求反馈。
所以,我厌倦了wandb和langfuse。我创建了自己的服务,所以我构建了自己的工具。目前它能:自动检测循环和重复/冗余的工具调用 - 将会话全程记录并回放为可读时间线,而非平面跨度列表 - 让你在同一任务中并排比较不同的代理/模型。寻求你的反馈,请试试。
相似文章
我厌倦了手动调试追踪
一位开发者构建了一个AI代理调试工具,通过比较重放与参考运行来识别行为首次偏离的位置,表达了对手动追踪调试的挫败感。
@benhylak:我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……
一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试,允许使用codex和Claude code等工具自动编写评估并进行测试。
需要直率反馈:我构建了一个用于记录AI代理运行的工具
一位开发者构建了agentproof-recorder来记录AI代理运行并检测规则违规,寻求反馈这是否是一个常见的痛点。
智能体工作流可视化工具:反馈与修正
介绍了一款用于可视化AI智能体工作流的工具,支持多种智能体框架,包括Langgraph、CrewAI、AutoGen、Google ADK和OpenAI Agents SDK。创作者正在寻求社区的反馈与修正。
寻求关于这款名为agentshark的开源工具的反馈
作者介绍了agentshark,这是一款开源工具,用于检查agent交互、调试工具调用流程以及与团队成员共享会话轨迹。