@benhylak:我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……
摘要
一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试,允许使用codex和Claude code等工具自动编写评估并进行测试。
我们构建了第一个本地调试智能体的合理方法。
你可以查看追踪记录。codex/claude code 也可以。这使得它们能够自动编写评估并测试你的智能体。
最棒的是:它完全免费且开源。一行命令即可安装。
(GitHub 地址如下)https://t.co/ln5LEZzEHu
查看缓存全文
缓存时间: 2026/05/14 20:41
我们构建了首个在本地调试智能体的合理方式。
你可以看到追踪记录。Codex/Claude Code 也能查看追踪记录。这使它们能够自动编写评估和测试你的智能体。
最棒的是:它完全免费且开源。一行命令即可安装。
(GitHub 链接如下)https://t.co/ln5LEZzEHu
相似文章
我厌倦了AI开发工具把一切都困在云端,所以我构建了...
AgentBuddy 是一个本地优先、开源的 AI 工作流沙盒,支持持久化代理线程、实时执行追踪和事件驱动工作流,集成了 Claude Code,旨在让 AI 开发保持本地化和透明化。
开源面板可视化 AI 编程代理(Claude Code)
开发者发布了一款中世纪主题的开源面板,将多个 Claude Code 代理以 2D 村庄角色的形式可视化,简化并行编码会话的实时跟踪。
@adithya_s_k: 你现在可以直接用 TRL 对模型在智能体轨迹上进行微调:Claude Code 轨迹、Codex 轨迹、OpenClaw 轨迹、Pi 轨迹……
TRL 现在支持对来自各种来源(如 Claude Code、Codex、OpenClaw 和 Pi)的智能体轨迹进行模型微调,这正朝着训练智能体模型的标准化栈迈进。
@claudeai: Claude Code 新增功能:agent view(智能体视图)。一个统一列表,展示所有会话,现已作为研究预览版上线。
Anthropic 在 Claude Code 中发布了新的“agent view(智能体视图)”功能,提供了一个统一列表以显示所有会话,目前作为研究预览版提供。
我构建了AgentLighthouse——一个本地的“AI代理灯塔”,用于扫描仓库/文档/API以评估代理就绪状态
AgentLighthouse 是一个本地优先的工具,用于扫描仓库、文档和API,评估AI编码代理(如 Codex、Claude Code、Cursor)能够多大程度上理解和正确使用一个项目。它会检查代理指令文件、文档质量、设置清晰度、OpenAPI 操作质量、MCP 工具描述等。