toolathlon

标签

Cards List
#toolathlon

Step 3.7 Flash 开放权重今日发布,而智能体可靠性数据确实引人注目

Reddit r/artificial · 2026-05-29

Step 3.7 Flash 是一款开放权重的 198B 稀疏 MoE 模型,声称在 tau2-bench 上所有难度级别均达到 98% 的智能体可靠性,原始能力中等但多步一致性强劲。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈