@NataliaZarina: 当团队中每个人都能访问不知疲倦工作的训练有素的智能体时,会发生什么?"这会创造更多需要专家判断的情况……"
摘要
本文探讨了一个悖论:人工智能自动化非但没有消除工作岗位,反而增加了工作量和对专家人工判断的需求,挑战了AI将取代知识工作者的说法。
查看缓存全文
缓存时间: 2026/05/23 14:09
当你的团队中每个人都能使用持续工作的训练有素代理时会发生什么?
“这会创造更多需要专家判断的情况……实际上,AI并没有消除人类专家的知识工作。它极大地增加了完成的工作量,而这些工作如果没有人类参与,就没有任何差异化或价值。” - @danshipper
自动化之后
来源:https://every.to/p/after-automation
AI进步为人类创造的工作更多,而非更少
AI的核心存在一个悖论。
在Every(https://every.to/),我们已经自动化了一切可以自动化的东西。我们在编码、写作、设计、客户服务等领域使用Codex和Claude Code。我们在OpenAI、Anthropic和Google的新模型发布前进行alpha测试。我们正尽可能快速、尽可能远地乘上模型智能和自动化的指数级增长浪潮。
然而,对我们来说,人类的工作似乎比以往任何时候都多。我们是一个近30人的团队,并没有为了代理而解雇所有员工。我们没有抛弃软件即服务(SaaS)产品,转而使用vibe coded应用。我们仍然雇佣人类来做客户服务(虽然有很多代理辅助),我们仍然雇佣人类作家、编辑和工程师。
不过,我们的工作看起来确实与以前完全不同。我们不再手动编写代码。如果你在Slack中@某人,你无法确定是在和人类还是代理说话。管理者像个人贡献者一样提交代码,工程师直接与客户沟通。在过去几周里,AI回复了我95%的工作邮件。我几乎总是处于收件箱为零的状态(对我来说极为罕见),但我仍然会查看我的邮件。
简而言之,未来看起来既奇怪又熟悉。
这种熟悉感令人惊讶,因为CEO、知识工作者和投资者似乎都同意AI对就业、经济、安全和人类意义构成威胁。
Anthropic的CEO Dario Amodei警告说,AI可能会消灭多达一半的初级白领工作(1)(https://every.to/p/after-automation#marginalia-cite-1)。Meta刚刚裁掉了8000人(https://www.wsj.com/tech/meta-will-lay-off-8-000-employees-in-may-memo-ce8b97f0),并正在美国员工的电脑上安装软件,以捕捉鼠标移动、点击和击键,从而获取更高质量的AI训练数据,涉及高级知识工作。
就连Citadel的Ken Griffin似乎也感到不安(https://x.com/FundamentEdge/status/2055675389767516544),他最近说:“这些不是中等级别的白领工作。这些是极高技能的工作,我要选一个词,被代理AI自动化。”
随着每个新模型的推出,基准测试呈指数级增长,似乎也印证了这一点。在人类最后一次考试——一项研究生级推理测试中,顶级模型从一年前的低个位数涨到了今天大约44%。在GDPval——一项衡量前沿模型与人类相比在现实经济工作中表现如何的测试中,前沿模型从类似的低点跃升至大约85%。5月,AI安全研究非营利组织METR发布了一个早期的Claude Mythos结果,显示模型在人类专家大约需要4小时完成的任务上成功率为80%。
看来我们正处在一个比任何人类都聪明、能够连续工作近一整天的AI的门槛上。
然而,悖论依然存在。如果你与AI行业的任何人——或行业外的早期采用者交谈,你会听到我们内部注意到同样的事情:工作比以往任何时候都多。
行业内外的重大问题是:这只是暂时的状态吗?下一个模型发布是否会取代所有人?我们盯着基准测试,紧张不安,想知道是否有一个临界点就在转角处,所有工作岗位都会消失。
没有临界点,事情不会翻转,工作也不会消失。新的现实恰恰相反——我们自动化得越多,需要做的专家级人类工作就越多。
原因如下:AI商品化了人类专业知识的残留物——任何可以被明确表达出来以便训练的东西。这降低了默认模型输出的价值,并产生了对差异化的需求。对差异化的需求就是对人类专家的需求,即使我们接近人工通用智能(AGI)也是如此。
要理解为什么,我们必须超越图表,看看AI在当今工作中是如何使用的。这将帮助我们以更具体的方式看清悖论及其解决方案。
我们是如何走到这一步的
从2022年开始,我们就在报道与代理合作的工作未来。
三年前,我写了关于分配经济(https://every.to/chain-of-thought/the-knowledge-economy-is-over-welcome-to-the-allocation-economy)(2)(https://every.to/p/after-automation#marginalia-cite-2)的文章:使用AI工具的工作最终会看起来很像人类管理者的工作。那时,ChatGPT内的基本提示和回复仍被认为具有惊人的未来感。
然后,作为一家公司,我们在2025年年中开始极度拥抱Claude Code。Cora(https://cora.computer/)的总经理Kieran Klaassen(https://every.to/@kieran_1355)突然发现,他可以放弃手工编写代码,转而整天在终端中向编码代理发送简单的英文指令。这迅速扩展到整个组织,并且12个月前在Lenny’s Podcast上,我称Claude Code为知识工作中最被低估的工具(https://www.lennysnewsletter.com/p/inside-every-dan-shipper)。
我提出这一点,是因为我们最好的预测都来自将Every视为一种早期采用者实验室。我们往往在新工作模式被规范化之前就遇到它们,随着技术的成熟和工具变得更容易使用,这些模式开始出现在更广泛的市场中。
以下是内部目前正在发生的事情。
与代理合作的两种模式
与AI的合作开始分化成两种非常不同的模式(3)(https://every.to/p/after-automation#marginalia-cite-3)。
第一种是AI讨论很好地预测的模式:作为员工的代理。这些是你委派工作的代理。有些代理存在于Slack中,有名字和职务,当你希望他们做某事时可以@他们。有些代理嵌入到持续的工作流程中——比如客户服务——作为重复性任务的始终在线的守门人。
第二种模式更奇怪,而且根据我的经验,更重要。这是在Codex、Claude Code和Claude Cowork等工具中的人机协作。这些不仅仅是交办工作的地方。它们正在成为工作本身的操作系统,在这里你和多个代理同时使用同一台计算机,进行高度复杂、原创的工作,而这些工作是异步代理无法完成的。
在这两种模式中,你都可以使用AI来自动化和委派你的大部分工作——并且这两种模式都需要你或另一个人才能良好运作。
代理员工
代理员工被分配一个任务,然后去生成答案、行动、报告、草稿、分流决策,而无需你介入。这些至少有两种类型:同事代理和嵌入式代理。
同事代理
同事代理是你可以例如在Slack中@并请求其工作的代理。它在你需要时随时可用。这些是类似OpenClaw(https://every.to/guides/claw-school)或我们内部使用的Plus One(https://every.to/plus-one)风格的代理。
Claudie
Claudie是我们咨询团队的同事代理。Claudie撰写销售提案,创建培训资料的初稿,跟踪项目待办事项等。
Andy
Andy是我们编辑团队的同事代理。她收集“金块”——来自我们内部Slack的好故事创意——并将它们转化为摘要和初稿,供我们的作家用来编写每日新闻通讯。
Viktor
Viktor(https://viktor.com/blog/viktor-series-a)是一个通用代理,在整个组织中工作。我们使用他来收集增长指标、分析用户调查,并将混乱的内部讨论转化为研究备忘录和产品建议。
嵌入式代理
嵌入式代理存在于产品工作流程中。它们灵活性较低,但处理重复性任务可能非常强大。
Fin是最清晰的例子——一个嵌入我们客户服务平台中的代理,通过聊天和邮件处理我们的很大一部分支持负载。
在5月的一周中,Fin参与了202个Every支持对话中的65%,并自行关闭了81个,占所有可操作对话的40.1%。
像这样的嵌入式代理允许我们的客户服务经理Waqqas Mir花更少时间回复基本工单,而用更多时间构建回复工单的系统,以及处理需要高接触互动的复杂案件。
人机协作
在两种形式——同事代理和嵌入式代理——中,模式相同。员工代理接管了更稳定、可重复、框架清晰的工作层。但仍有大量工作需要人类参与。我们一次又一次地发现,对于任何类型的复杂任务,获得出色工作的最佳方式是让AI和人类在同一工作空间内来回互动。
这就是Codex、Claude Code和Cowork的用途。它们允许你跨多个聊天线程启动并委派工作给一个或多个代理。这些代理可以访问你的计算机和所有数据源。你可以看到每个代理正在做和思考的任务——并且可以随时中断。
你负责在每个任务开始和结束时管理代理,确保任务完成得好,并找到下一个工作事项。Kieran称之为人类的“三明治”(https://every.to/context-window/you-re-the-bread-in-the-ai-sandwich)——我们是AI工作两端的面包。
人类三明治:人类设定框架,AI完成任务,然后人类判断并扩展结果。人类三明治。来源:Every。
最明显的例子是编码。Every的工程师整天和代理来回互动。他们规划新功能或错误修复,审查已完成的工作,并且——如果他们使用我们的复合工程(https://every.to/guides/compound-engineering)理念——调整系统以随时间改进。
但这种协作远不止于编码。
知识工作的新操作系统
Codex和Claude Code正在成为工作的新操作系统。我几乎一整天都在Codex中度过,通过其应用内浏览器运行我的SaaS工具。它让我能将我的代理带到我所做的每一件事上——并以我独自无法达到的水平运作。
写作
我是在Codex应用内浏览器的Proof(https://www.proofeditor.ai/)中撰写本文的。Codex观察我写的内容,并可以启动一个子代理来完成我需要的任何任务:写一段的初稿,为下一部分研究例子,进行文字编辑。
在Codex内部的Proof中撰写本文。在Codex内部的Proof中撰写本文。来源:Every。
邮件
我也是以同样的方式处理邮件。Cora是我的邮件客户端,我在Codex的应用内浏览器中运行它——滚动我的收件箱,并用Monologue(https://monologue.to/)大声讨论每个项目。其余由Codex和Cora处理。
一次Cora收件箱清理。一次Cora收件箱清理。来源:Every。
每个代理都需要一个人
在所有这些自动化的过程中,你可能已经看到了人类的用武之地。在每个例子中,代理都需要一个人才能使工作,嗯,发挥作用。
必须有人将代理指向正确的事情,决定输出是否良好,捕捉它错误的地方,并将结果转化为现实中的决策或流程。
代理离负责确保其良好运作的人类越远,其工作效果就越差。在我们最初内部推出“代理作为员工”时,我们给了每个员工一个代理(https://every.to/context-window/every-is-half-agent-now),但很快我们就转向了为特定团队或整个公司工作的代理(https://every.to/source-code/we-gave-every-employee-an-ai-agent-here-s-what-we-re-doing-differently-now),而不是为个人。
为什么?代理需要大量的维护,而个人代理在与其合作的员工放弃它们后很快就会变得过时。我们有一个AI工程师团队负责确保我们的代理运行良好——而且我们在可预见的未来都需要他们。即使像自动构建PowerPoint演示文稿这样简单的事情也可能变成一项巨大的任务。我们其中一个PowerPoint自动化包含24项技能和18个脚本,制作一个演示文稿需要花费62美元的token。
这是代理为人类创造更多工作的一阶原因。
但还有二阶原因。
为什么自动化为人类创造更多工作
如果你观察AI在过去几年的指数级轨迹,并思考其架构如何运作以及其能力来自何处,你会发现清晰的反馈循环,创造了更多的人类工作。
AI让昨天的人类能力变得廉价
当前语言模型是基于人类能力的可见残留物进行训练的(4)(https://every.to/p/after-automation#marginalia-cite-4):代码、散文、图像、支持工单、产品规格等。它们获取所有这些——成功完成任务后的副产品——并将其打包成一种对任何人都低成本获取的形式。
净效果是,曾经稀缺的技能——编写拉取请求、制作YouTube缩略图、撰写新闻通讯——现在几乎对任何人都广泛可用。
廉价能力被迅速采用
当曾经稀缺的东西成本下降时,供应突然大幅增加。
在Every,我们经常看到这一点。运营和客户服务人员在编写代码并提交拉取请求。营销人员在制作YouTube缩略图。工程师和产品人员在撰写文章、指南和登陆页面的草稿,而他们以前从未这样做过。
这在Every之外也普遍发生。以OpenClaw这个开源AI代理项目为例:截至2026年5月16日,其仓库已收到44,469个拉取请求,其中自4月1日以来有12,430个,自5月1日以来有3,990个。这个数量令人震惊。作为对比,Kubernetes(https://kubernetes.io/),世界上最流行的开源项目之一,在2022年全年收到了5,200个拉取请求。
充裕导致同质化——旧的专业知识变得商品化
因为每个人都使用相同的模型,而模型都基于昨天的能力,默认情况下,模型最终产生的工作从“一个不错的起点”到“简直是垃圾”不等。
垃圾不是指任何特定的错误。不是使用长破折号,或某种句子节奏,或登陆页面上的紫色强调色。垃圾是明显的同质化,令人作呕地重复。
当处于不同情境中的人类使用相同的工具、基于相同的语料库、没有深入思考时,默认就会产生这种情况。当每个人都能接触到具有相同默认倾向的专家时,就会发生这种情况。
当运营人员可以提交拉取请求,营销人员可以在几秒钟内创建YouTube缩略图,或者工程师在编写产品指南时,很容易陷入这样一个世界:你的产出增加了,但你生产内容的质量、一致性和差异化却下降了。
大量的同质化迅速变成商品。
同质化创造对差异的需求
人类通过互联网很快学会识别什么是垃圾。任何作品都能瞬间触达其他人,而
相似文章
@brooksjordan: 这完全是我的经历。有强大的智能体自动化,但也有人机协作,……
Brooks Jordan分享了他的经历:尽管AI智能体自动化很强大,但人机协作对于高质量工作仍然至关重要,他引用了Every的报告,说明AI如何增加了对人类专业知识的需求。
AI代理不会取代优秀的员工,而会揭露谁只是在假装忙碌。
文章认为,AI代理将自动化许多办公室工作赖以显得高效的那些琐碎任务,从而暴露出那些只是看起来忙碌而非创造真正价值的员工。
@rohanpaul_ai: "每个智能体都需要一个人。智能体离实际操作它的人越远,表现就越差。即使AI..."
Dan Shipper, Every的CEO,表示AI智能体仍然需要人类监督,并且尽管AI具备专家级能力,但它实际上增加了对人类专家的需求。
你们真的认为人工智能代理能很快替代人类完成更大任务吗?
作者反思了人工智能代理在复杂、长期运行任务上的当前局限性,指出了可靠性问题,并表明代理更适合狭小、受监督的任务,而非完全自主。
AI代理如何重塑知识工作:自主性、效率与范围
本研究使用Perplexity的生产数据,比较AI代理与对话式助手,发现代理将完成任务时间减少87%,成本降低94%,同时扩展了知识工作的范围和质量。