@QuinnyPig: 一直在思考一个真正的“代理原生云”应该是什么样的。提到这个,@Vercel 的 CEO 回复了…
摘要
Corey Quinn 讨论了代理原生云的需求,而 Vercel 的 CEO 回应说 Vercel 将会构建它,引发了关于云基础设施未来的讨论。
查看缓存全文
缓存时间: 2026/05/18 04:27
一直在思考“智能体原生云”到底应该长什么样。我提到这事后,@Vercel的CEO回复说,他们就是那个答案。很酷!以下是他们(或 @Cloudflare,或某个尚未诞生的初创公司)必须达成的规范。
不会是 @awscloud。
讨论……
-
有门控的变更。智能体不直接修改生产环境。它提交PR,触发一个Action,提出一个由人类(或另一个智能体)审查的更改。到目前为止,智能体还没有绕过这种模式——平台应该让这成为阻力最小的路径。
-
别再让智能体每启动一个服务就让我找一遍API密钥。解决办法是密钥代理:平台持有密钥,智能体获取句柄,调用通过代理进行。一个被攻破的智能体无法泄露它从未持有的东西。
-
API必须一致。240个服务,各有各的动词、分页方式和区域怪癖,这就是为什么Claude Code在寻找正确命令时会卡壳,然后在错误的账号里执行它。
智能体继承AWS的不一致税,税率比人类还高。
-
智能体需要自己的身份。现在每个动作都通过人类的IAM角色洗白,所以审计日志显示“corey@duckbill 执行了此操作”,而事实是“Claude 凌晨2点的第三次重试执行了此操作”。 第一类智能体身份:有范围、可证明、有时限、可撤销。
-
硬性预算上限,并且真正停止。不是AWS的“我们注意到你昨天花了4.7万美元,这里有个CloudWatch邮件”那种方式。在边界处自动关闭。一个Lambda卡在循环里,产生数据传输或推理费用,这是真实的故障模式;把它当作故障来处理!
-
成本断路器,附带人工升级。智能体会话有配额。消耗速度超出预期 -> 通知人类,授权更多配额或直接终止。等到月底才发现,这就是每隔一周你就得面对一个5万美元的“哦不”媒体报道的原因。
-
成本预览作为一等API。在任何改变状态的调用之前:“这将增加约340美元/月的固定成本,加上每千次请求0.09美元。”现在大多数定价基于用量,因此预览不能只说“X美元”。
智能体不擅长AWS定价,因为AWS定价本身就差到不像是价格。
-
为LLM可执行而设计的错误消息。不是“AccessDenied: User arn:aws:… 未被授权,因为不存在基于身份的策略允许此操作。” 更像是:“拒绝:此智能体缺少对‘users’表的dynamodb:Query权限;所有者可通过链接授予权限。”错误信息是指令,而不是谜题。
-
爆炸半径作为基本概念。“此会话最多可花费X,最多接触N个资源,在Y环境中,30分钟后过期。”具备能力边界的会话,内建其中。现在每个智能体要么是上帝模式,要么被完全隔离。整个有趣的设计空间在两者之间。
-
默认具备时间旅行。每个状态变更在某个窗口内是可逆的。“回滚过去20分钟”是一条命令,而不是一次通过CloudTrail招魂,最终你只能恢复昨天的快照,同时丢失四小时客户数据和智能体的错误。
-
可观测性将操作->推理->成本关联。不是“Lambda X 触发了”,而是“智能体在尝试任务Y时调用了Lambda X,由请求Z触发,花费0.0003美元,在5美元的会话预算内。”这是AI原生的分布式系统dmesg。目前还没有人拥有。
-
惯例优于配置,毫不留情。AWS在1000件事情上强制你做出明确选择,而其中95%明显只有一个正确选项。智能体原生平台应该对默认设置有强硬的意见,当需要询问时,询问人类,而不是独自胡乱尝试。
以上大多数之所以重要,只是因为智能体是半自主运行的。如果你手动输入提示并盯着每一步,你只需要一个不那么坑爹的CLI。有趣的工作在于当智能体无人值守运行,而你必须信任平台不会烧钱时,情况会发生什么变化。
哦,好眼力。
是的,这从来不是我的菜。真正的灌水者是为了热爱而玩。
我把我的AI垃圾安全地关在 http://shitposting.ai 里。
@QuinnyPig 说得太好了。
我们正在构建的执行层已经实现了2、3、4、11。 2 -> 实际上,为什么只限于API密钥?也可以用于登录。 3 -> 我们从一致规格开始,针对一组MCP、API、GraphQL,这也带来了很大不同! 4 -> 解决起来很有意思。 11 -> 在产品上还没看到大量使用,但我们已经做了这个。
正在开发中 -> 8、5、6、7、9(按我们的执行顺序)
10和12很有意思,我很乐意进一步聊聊这些。
相似文章
@walden_yan: 如果你正在构建自己的云代理,比如Devin或Ramp Inspect,这里有关于设置虚拟机的许多精彩细节……
与Walden Yan (Cognition)和Cole Murray (OpenInspect)深入探讨构建云代理,涵盖虚拟机设置、计算机使用、内存以及异步代理在AI工程领域的兴起。
为什么Vercel要为作为一等公民的智能体设计编程语言
Vercel的Chris Tate正在开发Zero,一种专为作为一等公民的智能体设计的编程语言,旨在实现最高效率。
@charlieholtz: 在云端运行一群编码代理...
该文章宣布了在云端运行一群编码代理的能力。
@ashwingop: https://x.com/ashwingop/status/2052777467732283817
对Claude的“托管代理”(Managed Agents)的分析,将其视为下一代AI基础设施层——“公司大脑”(Company Brain)的先兆。这是一个运营状态层,使代理和应用能够基于共享的公司上下文行动,与更简单的知识库或基于Markdown的原型形成对比。
@latentspacepod: Daytona 的 Agent-Native 计算:60毫秒沙箱,75秒内启动5万个沙箱,每日85万次运行,RL/评估,CLI优于MCP,以及终结…
Daytona 首席执行官 Ivan Burazin 讨论了他们的 Agent-Native 计算平台,该平台提供60毫秒沙箱、有状态快照,并支持 RL/评估,标志着从本地开发到基于云的代理基础设施的转变。