@sashimikun_void: @serenaa_ge 请提供 Deepswe 基准测试

X AI KOLs Following 产品

摘要

Sakana AI 发布了 Sakana Fugu,这是一个多智能体编排系统,可通过单一模型 API 访问,其中 Fugu Ultra 模型在无出口管制风险的情况下达到了前沿性能。

@serenaa_ge 请提供 Deepswe 基准测试 🙏
查看原文
查看缓存全文

缓存时间: 2026/06/23 13:50

@serenaa_ge 请提供 Deepswe 基准测试 🙏

Sakana AI (@SakanaAILabs): 隆重推出 Sakana Fugu:一套可通过单一模型 API 访问的完整多智能体编排系统。

我们的「Fugu Ultra」模型性能与 Fable 和 Mythos 相当,提供前沿能力且无需面临出口管制风险。

立即体验:https://t.co/aDEFyySWlS 🐡

相似文章

Sakana Fugu

Hacker News Top

Sakana Fugu 通过单一 API 动态编排多种顶级模型,以处理复杂的多步骤任务。它利用其在 ICLR 2026 论文中提出的学习型编排方法,实现了前沿水平的性能,同时避免了对单一供应商的依赖。

Sakana Fugu(三分钟阅读)

TLDR AI

Sakana AI 推出 AB-MCTS,一种推理时缩放算法,使多个前沿 AI 模型(Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528)协同工作,在 ARC-AGI-2 基准测试中显著优于单个模型。