@AYi_AInotes: 全网都在吹日本Fugu跑分超GPT,但我敢说99%的人没看懂它真正炸场的地方。 首先这玩意儿根本不是什么超大单体大模型, 它全身上下只有0.6B参数,本职工作就其实就是个AI项目经理, 简单任务自己处理,复杂任务自动拆分,从全球顶级模型池…
摘要
Sakana AI 发布 Fugu,一个仅 0.6B 参数的多智能体编排系统,通过智能任务拆分和模型协作达到前沿性能,绕开了传统的参数量扩增路径,标志着多智能体编排正式成为可用的生产力工具。
查看缓存全文
缓存时间: 2026/06/23 14:09
全网都在吹日本Fugu跑分超GPT,但我敢说99%的人没看懂它真正炸场的地方。
首先这玩意儿根本不是什么超大单体大模型,
它全身上下只有0.6B参数,本职工作就其实就是个AI项目经理,
简单任务自己处理,复杂任务自动拆分,从全球顶级模型池里挑最合适的选手,分配思考执行验证三种角色,多轮协作最后合成答案。
你调用它和调普通模型没区别,一行API的事, 但背后的编排策略是训练出来的,不是人手写prompt调路由磨出来的,它可以发掘出人类根本想不到的协作模式。
我觉得最狠的还不是跑分超了Claude和GPT,关键是它直接绕开了scaling law的军备竞赛。
不用堆万亿参数,不用砸超算中心,靠更聪明的协作机制就能摸到前沿模型的天花板,AI的竞争第一次从拼参数变成了拼管理。
当然不是银弹,比如黑箱不透明,复杂任务延迟更高,简单题用它反而更贵。
但这件事的信号意义比跑分数字重要一百倍,意味着多智能体编排从实验室玩具正式变成了可用的生产力工具。
orchestration layer这条新赛道,今天正式开跑咯
Sakana AI (@SakanaAILabs): Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API.
Our ‘Fugu Ultra’ model matches the performance of Fable and Mythos, delivering frontier capability without the risk of export controls.
Try it: https://t.co/aDEFyySWlS 🐡
相似文章
@mylifcc: 这不是普通的大模型,而是一个多代理编排系统(Multi-Agent Orchestration System)——它自己就是一个小模型,却能智能地动态协调 GPT、Claude、Gemini 等多个前沿模型,自主分配角色、拆分任务,完成复…
Sakana AI 发布了一个多代理编排系统(Multi-Agent Orchestration System),它通过一个小模型智能协调 GPT、Claude 和 Gemini 等前沿大模型来自主分配任务和处理复杂工作。
@DeRonin_: 我靠,日本公开发布了Fable级别模型,通过编程和研究基准测试,它几乎等同于……
Sakana AI 发布了 Fugu Ultra,这是一个多智能体编排系统,可通过单一模型 API 访问,其性能与 Fable 和 Mythos 模型相当。
@berryxia: 小块有大智慧?这下真成真了! 7B小模型现在直接当上了GPT-5、Claude Sonnet 4、Gemini 2.5 Pro这些顶级大模型的老板。 一篇最新论文里,一个用强化学习训练的7B模型学会了写自然语言子任务、分配给不同大模型、精…
一篇最新论文提出通过强化学习训练7B小模型作为任务调度器,自动分解子任务并分配给GPT-5、Claude等顶级大模型,在多项硬核基准上超越单一前沿模型,证明端到端奖励学习可有效替代人工Prompt工程与多智能体流水线设计。
@sashimikun_void: @serenaa_ge 请提供 Deepswe 基准测试
Sakana AI 发布了 Sakana Fugu,这是一个多智能体编排系统,可通过单一模型 API 访问,其中 Fugu Ultra 模型在无出口管制风险的情况下达到了前沿性能。
Sakana Fugu
Sakana Fugu 是一个新工具,能够将多个AI模型组合成一个,受“一个模型统领所有”概念的启发。