@rohanpaul_ai: Sakana Fugu Ultra 在实时交易终端编码测试中凭借视觉精美度击败其他模型,接近 GLM 5.2,…

X AI KOLs Following 模型

摘要

Sakana 的 Fugu Ultra 模型编排系统在交易终端 UI 的实时编码测试中表现优于其他模型,尽管成本高出 17 倍,但展示了其在视觉精美度和多智能体协调方面的优势。

Sakana Fugu Ultra 在实时交易终端编码测试中凭借视觉精美度击败了其他模型,接近 GLM 5.2,但成本是其 17 倍。 测试在 atomic[.]chat 上进行,这是一款可在本地运行 LLM 的桌面应用。 Fugu 生成了最丰富的界面,包含多个面板、自选股列表、图表、实时报价活动、状态标签,整体完成度更高。 值得注意的是,Fugu Ultra 是一个编排层,通过一个兼容 OpenAI 的端点,跨模型池组装并分配子任务。 因此,Fugu 是一个多智能体系统中的学习型协调器模型。 当你发送提示时,Fugu 会决定是独立回答,还是将任务的部分分配给其他模型,然后收集输出并生成一个最终响应。
查看原文
查看缓存全文

缓存时间: 2026/06/23 09:47

Sakana Fugu Ultra 刚刚在一次实时交易桌面编码测试中,在视觉精致度上击败了其他模型,接近 GLM 5.2 的水平,但成本却是其 17 倍。

该测试在 atomic[.]chat 上进行,这是一款本地运行大语言模型的桌面应用。

Fugu 生成的界面最为丰富,包含多个面板、自选列表、图表、磁带式活动信息、状态标签,整体完成度更高。

值得注意的是,Fugu Ultra 是一种编排层,它通过一个兼容 OpenAI 的端点,将子任务组装并路由到多个模型组成的模型池中。

因此,Fugu 是一个在多智能体系统内经过学习的协调模型。

当你发送提示时,Fugu 会决定是独立回答,还是将任务的各个部分交给其他模型处理,然后收集输出并生成最终回复。

atomic.chat(@atomic_chat_hq): Sakana Fugu 出人意料地接近 GLM 5.2 的水平,但成本高出 17 倍!

我们向 4 个模型给出了相同的提示:构建一个完整的实时交易桌面,包含前端和后端组件,从外部 API 实时获取 8 个交易品种的市场数据,并采用自定义深色主题。

相似文章

Sakana Fugu

Hacker News Top

Sakana Fugu 通过单一 API 动态编排多种顶级模型,以处理复杂的多步骤任务。它利用其在 ICLR 2026 论文中提出的学习型编排方法,实现了前沿水平的性能,同时避免了对单一供应商的依赖。

Sakana Fugu(三分钟阅读)

TLDR AI

Sakana AI 推出 AB-MCTS,一种推理时缩放算法,使多个前沿 AI 模型(Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528)协同工作,在 ARC-AGI-2 基准测试中显著优于单个模型。

Sakana Fugu

Product Hunt

Sakana Fugu 是一个新工具,能够将多个AI模型组合成一个,受“一个模型统领所有”概念的启发。