人们如何在编码代理运行之间保存调试路径?
摘要
一个关于在编码代理运行之间保存调试路径的讨论,提到Visr工具会将轨迹与差异一起保存,并询问其他人如何处理这个问题。
这一切都是“记忆”吗?Git差异告诉下一个代理什么发生了变化,但没有说明导致这些变化的命令、重试、失败尝试或推理。我们在Visr中通过将轨迹与最终差异一起保存来解决这个问题。很好奇其他人现在是如何解决这个问题的:shell历史记录、转录、自定义日志、代理记忆,还是其他方法?
相似文章
我厌倦了手动调试追踪
一位开发者构建了一个AI代理调试工具,通过比较重放与参考运行来识别行为首次偏离的位置,表达了对手动追踪调试的挫败感。
当你的智能体在生产环境中出错时,如何定位哪一步出了问题?
一位开发者分享了在多步骤智能体生产调试中遇到的挑战——由于复杂的工具使用和自信的错误回答,失败难以追踪,并向社区寻求更好的监控和回归检测方法。
当你离开电脑时,如何监控长时间运行的本地编码代理?
讨论了当你离开电脑时监控长时间运行的本地编码代理的方法。
@benhylak:我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……
一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试,允许使用codex和Claude code等工具自动编写评估并进行测试。
给在生产环境中运行 AI 代理的朋友们一个快速问题
一个问题,指出 AI 代理记忆层缺乏可观测性,询问团队在没有完整追踪能力的情况下如何调试错误的检索结果。