@sashimikun_void: @serenaa_ge 请提供 Deepswe 基准测试

X AI KOLs Following 2026/06/22 05:13 产品

multi-agent orchestration model-api sakana-ai fugu-ultra frontier-capability

摘要

Sakana AI 发布了 Sakana Fugu，这是一个多智能体编排系统，可通过单一模型 API 访问，其中 Fugu Ultra 模型在无出口管制风险的情况下达到了前沿性能。

@serenaa_ge 请提供 Deepswe 基准测试 🙏

查看原文

查看缓存全文

缓存时间: 2026/06/23 13:50

@serenaa_ge 请提供 Deepswe 基准测试 🙏

Sakana AI (@SakanaAILabs): 隆重推出 Sakana Fugu：一套可通过单一模型 API 访问的完整多智能体编排系统。

我们的「Fugu Ultra」模型性能与 Fable 和 Mythos 相当，提供前沿能力且无需面临出口管制风险。

立即体验：https://t.co/aDEFyySWlS 🐡

相似文章

@DeRonin_: 我靠，日本公开发布了Fable级别模型，通过编程和研究基准测试，它几乎等同于……

X AI KOLs Following

Sakana AI 发布了 Fugu Ultra，这是一个多智能体编排系统，可通过单一模型 API 访问，其性能与 Fable 和 Mythos 模型相当。

Sakana Fugu

Hacker News Top

Sakana Fugu 通过单一 API 动态编排多种顶级模型，以处理复杂的多步骤任务。它利用其在 ICLR 2026 论文中提出的学习型编排方法，实现了前沿水平的性能，同时避免了对单一供应商的依赖。

@rohanpaul_ai: Sakana Fugu Ultra 在实时交易终端编码测试中凭借视觉精美度击败其他模型，接近 GLM 5.2，…

X AI KOLs Following

Sakana 的 Fugu Ultra 模型编排系统在交易终端 UI 的实时编码测试中表现优于其他模型，尽管成本高出 17 倍，但展示了其在视觉精美度和多智能体协调方面的优势。

Sakana Fugu（三分钟阅读）

TLDR AI

Sakana AI 推出 AB-MCTS，一种推理时缩放算法，使多个前沿 AI 模型（Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528）协同工作，在 ARC-AGI-2 基准测试中显著优于单个模型。

Sakana Fugu，多智能体编排，性能媲美Fable和Mythos

Reddit r/singularity

Sakana Fugu是一个多智能体编排系统，据报道其性能与成熟系统Fable和Mythos相当。

提交意见反馈