Claude Opus 4.8 于5月28日发布,其一项特性揭示了AI真正的发展方向。它现在可以将一个任务拆解为数十个并行工作流并同时运行。
摘要
Anthropic 发布了具有动态工作流(Dynamic Workflows)功能的 Claude Opus 4.8,支持并行任务执行,并改进了判断能力,可标出不确定性,从而从工具转变为协作者。
Anthropic 两天前发布了 Opus 4.8。价格与前代相同。基准测试成绩登上了头条。但真正指明发展方向的特性是动态工作流(Dynamic Workflows)。其工作原理如下:你用单条提示描述一个庞大复杂的任务。Claude 不会线性地逐步处理,而是将其拆分为数十个同时运行的小型工作流,然后将结果综合成一个连贯的输出。一个恰当的类比:原本需要一个人整整一天才能完成的研究任务。有了动态工作流,就像50个人同时各自负责不同部分,最后有一个协调者汇总所有输出。任务完成时间缩短至几分之一。除了速度之外,这一点之所以重要还在于:两年来,与AI的交互模式本质上一直是线性的。你提问,它回答,你再提问。即使是智能体工作流也大多是按顺序执行步骤。动态工作流转向了并行执行,这对用户而言是截然不同的计算模型和思维模式。大多数人会忽略的实际含义是:你必须停止人为地压缩你的提示。两年来大多数用户养成的习惯是,将大任务分解成小块,因为AI处理小块效果更好。这个习惯现在已经适得其反。系统设计为接收整体并内部协调。如果你继续喂给它碎片,你就是在以串行模式使用并行系统。4.8 还有另一个同样重要但关注较少的改变:判断能力升级。之前的版本有时会给出自信且结构良好的答案,但实际上是错误的。在Anthropic的测试中,4.8 对不加批判地报告有缺陷结果的比例为0%,而之前版本有显著比例。它会标出自己的不确定性,并在你投入时间之前对缺陷计划提出质疑。将这两项改变放在一起,方向就很明确了。Claude 正从你操作的工具转变为你可以委托的协作者。并行执行意味着它可以承担真正的大型任务。更好的判断能力意味着你可以相信返回的结果。发布节奏(2月4.6,4月4.7,5月4.8)表明这一方向正在加速,而非趋于平稳。这些模型现在能做的事情与大多数人实际要求它们做的事情之间的差距,随着每次发布而扩大。最快缩小这一差距的人,正是那些扩大交给模型的任务范围的人。我将4.8的四个变化写在一份文档中,包含30个充分利用这些变化的提示,其中包括触发动态工作流的全范围提示,感兴趣请点击[此处](https://www.promptwireai.com/opusguide)。如果你在阅读后只做一件事,那就是把你一直在分解的最大任务,用一条提示完整交给Claude。它处理方式上的差异,正是未来发展方向最清晰的信号。
相似文章
推出 Claude Opus 4.6
Anthropic 宣布推出 Claude Opus 4.6,这是其最强大模型的升级版本,旨在提供更好的规划能力、更长的任务记忆以及更高的自主性。
Claude Opus 4.7 正式发布
Anthropic 发布了 Claude Opus 4.7,这是一款全新的 AI 模型,在高级软件工程、视觉能力和自我验证方面实现了显著提升。该版本包含专门的安全防护措施,现已通过 API 及主要云服务商提供。
@DanielMiessler: Claude Code 即将发布一个名为 /workflows 的功能,我认为这将极为重要。特别是对于……
Claude Code 即将发布 /workflows 功能,该功能将标准的商业工作转化为基于 SOP 的伪确定性工作流,作者认为这对企业级 AI 来说是一个重大进展。
“@mfpiccolo: Opus 4.8 已发布。以下是 @iiidevs 首席工程师的结论:进行了压力测试,它只是另一个无法真正理解……的语言模型”
Anthropic 发布了 Claude Opus 4.8,这是对 Opus 4.7 的增量更新,具有更精准的判断力和更长的自主工作能力,不过一些工程师对其在缺乏广泛指导下的代码生成能力仍持怀疑态度。
Anthropic Labs 推出 Claude Design
Anthropic Labs 发布了 Claude Design,这是一款由 Claude Opus 4.7 视觉模型驱动的新产品,允许用户与 AI 协作创建视觉设计、原型和演示文稿。