我开始认为电子表格代理缺少了让编程代理真正可用的东西:Git

Reddit r/AI_Agents 产品

摘要

作者认为电子表格代理采用缓慢,因为它们缺乏Git风格的协作基础设施(差异、审查、回滚),而这正是编程代理可用的原因。作者宣布发布了一个早期运行时以弥补这一差距。

我从事电子表格基础设施的工作,并且一直在思考为什么代理在编程领域迅速普及——但在以电子表格为主的团队中感觉要慢得多。我认为差异不在于模型能力。也不在于非技术团队对AI有抵触。事实上,当ChatGPT首次出现时,财务、人力资源、销售、运营和市场营销等团队在写作、总结、规划、研究和分析方面采用得非常快。需求显然存在。那么,为什么“代理时代”在编程领域仍然感觉领先这么多?我目前的信念是:**编程已经拥有了Git。** 不仅仅是作为工具的Git,而是作为人机协作操作环境的Git。 我参与一个开源电子表格项目,因此花了很多时间观察公司实际使用电子表格的方式。不是玩具般的电子表格,而是真正的操作工作簿:预测模型、收入报告、定价表、人员编制计划、佣金追踪表、销售运营系统、财务模板。这些文件已经包含了生产逻辑。而代理在操作它们方面已经变得出人意料地强大。它们可以编写公式、更新表格、转换数据、构建图表、自动化工作流程。从技术上讲,很多能力已经具备。**但是当代理开始触及重要的电子表格逻辑时,信任就会崩溃。** 因为即使电子表格的功能像软件系统,它们仍然表现得像文档。 在编程中,代理可以修改代码库,而人类仍然可以控制。你可以检查差异、审查更改、运行测试、批准更改、以后回退、追溯历史。这种基础设施彻底改变了情感体验。没有它,代理感觉有风险;有了它,它们变得可用。以电子表格为主的团队有着同样的底层需求。如果代理更新了一个预测工作簿,人们仍然需要知道: * 哪些内容发生了变化 * 哪些公式受到影响 * 计算是否正确刷新 * 下游指标是否意外移动 * 图表或格式是否损坏 * 谁批准了更改 * 如何恢复之前的版本 这些本质上是Git风格的问题。**问题在于电子表格包含生产逻辑,但大多数电子表格工作流程仍然缺乏生产级的协作基础设施。** 因此,我目前的信念是:电子表格代理不仅仅需要更好的提示或更大的上下文窗口。**它们需要一个Git风格的运行时:** 差异、审查、批准、回滚、可追溯性,以及人类与代理之间的结构化协作。这感觉像是缺失的那一层。 我们自己也一直在探索这个方向,并于今天发布了电子表格代理的早期运行时。仍然非常早期。可能不对。但我越来越认为,只有在人类能够安全地与代理协作——而不仅仅是提示它们——时,代理才能在操作工作流中真正变得可用。 很好奇其他人怎么看待这个问题。如果你曾尝试将代理引入财务、销售运营、人力资源、规划或以电子表格为主的工作流程,是什么真正阻碍了采用?
查看原文

相似文章

@itsclelia: I have one big problem with agentic engineering: I want agents to operate autonomously, but I also want granular, rever…

X AI KOLs Timeline

I have one big problem with agentic engineering: I want agents to operate autonomously, but I also want granular, reversible control over every change they make. I could solve this by committing every intermediate step to Git, but that would completely pollute my repo history. So I built 𝗮𝗴𝗴𝗶𝘁: a Git-like CLI for local and remote (S3-backed) agent artifact storage, written in Rust . With aggit, my agents can stash intermediate work, create branches safely, restore previous states, and back

感觉编码代理擅长找代码,但不擅长理解项目

Reddit r/AI_Agents

讨论了一个观察:编码代理虽能有效定位代码,但难以深入理解项目,比如组件关系和项目风格。作者介绍了 RepoWise,一个提供仓库级信号(如依赖图和Git历史)的工具来解决这些问题。