@benhylak：我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……

X AI KOLs Timeline 2026/05/14 18:10 工具

debugging agents open-source developer-tool tracing evals local-debugging

摘要

一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试，允许使用codex和Claude code等工具自动编写评估并进行测试。

我们构建了第一个本地调试智能体的合理方法。你可以查看追踪记录。codex/claude code 也可以。这使得它们能够自动编写评估并测试你的智能体。最棒的是：它完全免费且开源。一行命令即可安装。（GitHub 地址如下）https://t.co/ln5LEZzEHu

查看原文

查看缓存全文

缓存时间: 2026/05/14 20:41

我们构建了首个在本地调试智能体的合理方式。

你可以看到追踪记录。Codex/Claude Code 也能查看追踪记录。这使它们能够自动编写评估和测试你的智能体。

最棒的是：它完全免费且开源。一行命令即可安装。

（GitHub 链接如下）https://t.co/ln5LEZzEHu

相似文章

Reddit r/AI_Agents

AgentBuddy 是一个本地优先、开源的 AI 工作流沙盒，支持持久化代理线程、实时执行追踪和事件驱动工作流，集成了 Claude Code，旨在让 AI 开发保持本地化和透明化。

Reddit r/LocalLLaMA

开发者发布了一款中世纪主题的开源面板，将多个 Claude Code 代理以 2D 村庄角色的形式可视化，简化并行编码会话的实时跟踪。

X AI KOLs Following

TRL 现在支持对来自各种来源（如 Claude Code、Codex、OpenClaw 和 Pi）的智能体轨迹进行模型微调，这正朝着训练智能体模型的标准化栈迈进。

X AI KOLs Timeline

Anthropic 在 Claude Code 中发布了新的“agent view（智能体视图）”功能，提供了一个统一列表以显示所有会话，目前作为研究预览版提供。

Reddit r/AI_Agents

AgentLighthouse 是一个本地优先的工具，用于扫描仓库、文档和API，评估AI编码代理（如 Codex、Claude Code、Cursor）能够多大程度上理解和正确使用一个项目。它会检查代理指令文件、文档质量、设置清晰度、OpenAPI 操作质量、MCP 工具描述等。