@chamath: https://x.com/chamath/status/2054646394867364143

X AI KOLs Timeline 新闻

摘要

关于AI代理兴起的详细入门,包括统计数据、故障模式以及五层框架,重点介绍了从聊天机器人到自主任务导向型AI的转变。

https://t.co/zM6gObfWw1
查看原文
查看缓存全文

缓存时间: 2026/05/14 16:40

关于智能体AI经济的入门指南

2025年11月一个周五的傍晚,Peter Steinberger构建了OpenClaw的第一个版本。

原型只花了一小时左右,然而几周内,OpenClaw便收获了超过14.5万个GitHub星标,成为GitHub史上增长最快的开源软件项目。

该平台主要由AI代理构建,标志着从聊天机器人向自主任务导向型AI的转变。

而这种转变正在加速。如今Google 75%的新代码由AI生成,微软也有高达30%的新代码出自AI之手。截至2026年初,Claude Code在GitHub上的日提交量已超过13.4万次,而该工具在2025年3月刚推出时几乎为零。

这是软件构建方式——以及越来越多知识工作方式——的结构性变革。

AI代理正站在这一变革的前沿。

那么,究竟什么是AI代理?它和聊天机器人或LLM有何不同?为什么说这是结构性变化而非一时潮流?随着技术栈逐渐成熟,价值在哪里积累,又在哪里被商品化?

这些问题正是我们试图回答的。

最终成果是一个五层框架,用以说明代理的实际构成、技术发展方向,以及各层中谁有望胜出。

部分答案已能从数据中窥见。Anthropic的年化收入在17个月内从10亿美元飙升至440亿美元,几乎完全来自编码代理。与此同时,开源代理框架每月处理数万亿 tokens。这两组数字似乎指向同一个方向:框架层。

但代理仍然会犯明显的低级错误。2025年12月,一个亚马逊的编码代理自主删除并重建了线上生产环境,导致中国区AWS宕机13小时。2026年4月,一个由Claude驱动的Cursor代理在9秒内删除了整个公司数据库。

在生产环境中,有四种失败模式反复出现,且大多从未出现在供应商的定价表中。

麦肯锡2025年AI现状调查显示,不足10%的组织已将代理投入规模化应用。大多数组织根本未使用代理。

技术上可行与运营上落地之间的差距,恰恰是机遇所在。

我们Substack上这份84页的入门指南,希望能提供一份路线图。以下是内容概要:

  • 代理的五个层次及其相互关系

  • 早期采用者目前部署代理的六个案例研究,包括我的公司8090

  • 代理在生产环境中不可靠的四种方式

  • 我们预期随着模型商品化,哪一层将积累最持久的价值

  • 谁有望掌控这五个层次中的每一层

订阅阅读,并在群里告诉我你的想法:https://chamath.substack.com/p/ai-agents-primer

相似文章

@daniel_mac8: https://x.com/daniel_mac8/status/2054994899422826592

X AI KOLs Following

该讨论串指出,有最新证据表明AI代理已基本实现自主运作,其中Claude Mythos成功解决了此前未破解的网络攻击模拟实例,并超出当前基准测试测量极限,显示出超指数级进步。同时强调了安全影响及机构应对措施。

@ashwingop: https://x.com/ashwingop/status/2052777467732283817

X AI KOLs Timeline

对Claude的“托管代理”(Managed Agents)的分析,将其视为下一代AI基础设施层——“公司大脑”(Company Brain)的先兆。这是一个运营状态层,使代理和应用能够基于共享的公司上下文行动,与更简单的知识库或基于Markdown的原型形成对比。