如何为你的AI代理进行版本控制和回滚?git让我失望,我感觉自己遗漏了什么。

Reddit r/AI_Agents 新闻

摘要

一位开发者分享了使用git进行AI代理版本控制和回滚的困境,强调了提示词编辑导致的静默行为变化以及缺乏回归信号的问题。他们向社区寻求更好的工作流程。

我还在很初级的阶段,觉得自己可能做错了。我们把代理(提示词、工具、配置)像普通代码一样放在git里,但它总是给我们带来麻烦: * 一个微小的提示词编辑无声地改变了代理的行为;diff看起来完全无害,我们直到它影响到用户才发现。 * 当某些东西退化时,我可以回退提交,但我无法判断是哪个更改导致的。没有类似测试给你的“这个版本得分更差”的信号。 * 相同的提示词在模型或工具变化时表现不同,而git无法捕捉到这一点。 所以,我可能遗漏了实际的工作流程。对于在生产环境中运行代理的人:你们如何跟踪版本、比较行为并安全回滚?工具、技巧、电子表格——什么才是真正有效的?
查看原文

相似文章

Show HN:面向AI代理的Git

Hacker News Top

re_gent 是一个开源的版本控制系统,专为AI代理活动设计,记录每一次工具调用及其相关提示,使开发者能够审查和回滚代理的变更。

你究竟如何调试AI代理?

Reddit r/AI_Agents

开发者分享了在生产环境中调试AI代理的困境,指出了幻觉问题、提示词更改导致的回归以及高昂的API成本,并向社区征求策略。

@itsclelia: I have one big problem with agentic engineering: I want agents to operate autonomously, but I also want granular, rever…

X AI KOLs Timeline

I have one big problem with agentic engineering: I want agents to operate autonomously, but I also want granular, reversible control over every change they make. I could solve this by committing every intermediate step to Git, but that would completely pollute my repo history. So I built 𝗮𝗴𝗴𝗶𝘁: a Git-like CLI for local and remote (S3-backed) agent artifact storage, written in Rust . With aggit, my agents can stash intermediate work, create branches safely, restore previous states, and back