@rohanpaul_ai: Sakana Fugu Ultra 在实时交易终端编码测试中凭借视觉精美度击败其他模型,接近 GLM 5.2,…
摘要
Sakana 的 Fugu Ultra 模型编排系统在交易终端 UI 的实时编码测试中表现优于其他模型,尽管成本高出 17 倍,但展示了其在视觉精美度和多智能体协调方面的优势。
查看缓存全文
缓存时间: 2026/06/23 09:47
Sakana Fugu Ultra 刚刚在一次实时交易桌面编码测试中,在视觉精致度上击败了其他模型,接近 GLM 5.2 的水平,但成本却是其 17 倍。
该测试在 atomic[.]chat 上进行,这是一款本地运行大语言模型的桌面应用。
Fugu 生成的界面最为丰富,包含多个面板、自选列表、图表、磁带式活动信息、状态标签,整体完成度更高。
值得注意的是,Fugu Ultra 是一种编排层,它通过一个兼容 OpenAI 的端点,将子任务组装并路由到多个模型组成的模型池中。
因此,Fugu 是一个在多智能体系统内经过学习的协调模型。
当你发送提示时,Fugu 会决定是独立回答,还是将任务的各个部分交给其他模型处理,然后收集输出并生成最终回复。
atomic.chat(@atomic_chat_hq): Sakana Fugu 出人意料地接近 GLM 5.2 的水平,但成本高出 17 倍!
我们向 4 个模型给出了相同的提示:构建一个完整的实时交易桌面,包含前端和后端组件,从外部 API 实时获取 8 个交易品种的市场数据,并采用自定义深色主题。
相似文章
@DeRonin_: 我靠,日本公开发布了Fable级别模型,通过编程和研究基准测试,它几乎等同于……
Sakana AI 发布了 Fugu Ultra,这是一个多智能体编排系统,可通过单一模型 API 访问,其性能与 Fable 和 Mythos 模型相当。
Sakana Fugu
Sakana Fugu 通过单一 API 动态编排多种顶级模型,以处理复杂的多步骤任务。它利用其在 ICLR 2026 论文中提出的学习型编排方法,实现了前沿水平的性能,同时避免了对单一供应商的依赖。
Sakana Fugu,多智能体编排,性能媲美Fable和Mythos
Sakana Fugu是一个多智能体编排系统,据报道其性能与成熟系统Fable和Mythos相当。
Sakana Fugu(三分钟阅读)
Sakana AI 推出 AB-MCTS,一种推理时缩放算法,使多个前沿 AI 模型(Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528)协同工作,在 ARC-AGI-2 基准测试中显著优于单个模型。
Sakana Fugu
Sakana Fugu 是一个新工具,能够将多个AI模型组合成一个,受“一个模型统领所有”概念的启发。