Qwen3.7 Max在Artificial Analysis评测中得分，27B/35B等待室

Reddit r/LocalLLaMA 2026/05/20 07:18 模型

摘要

Qwen3.7 Max在Artificial Analysis基准测试中排名第五，与GPT-5.4持平，并超越了刚发布的Gemini 3.5 Flash，而Qwen3.6 27B则明显落后。

https://preview.redd.it/42ak5qmus82h1.png?width=1133&format=png&auto=webp&s=744ea3dfc06c83d0c4d8aa128c39b3238b17d7be Qwen 3.7 Max位列第五，与GPT 5.4 (xhigh)基本持平，略高于刚发布的Gemini 3.5 Flash。在另一端，我们看到DSV4 Flash和Qwen3.6 27B，后者比其最大版本正好落后6分。希望Qwen3.7也能与其最大版大哥处于同一水平。

查看原文

相似文章

Qwen3.6-35B-A3B 和 9B 已正式登上公开的 Terminal-Bench 2.0 排行榜！

Reddit r/LocalLLaMA

Qwen3.6-35B-A3B 和 Qwen3.5-9B 模型已正式登上 Terminal-Bench 2.0 排行榜，其中 little-coder 在 35B 变体上取得 24.6% 的成绩，超越了 Gemini 2.5 Pro 和 Qwen3-Coder-480B；而 9B 模型则表明，10B 以下的本地模型能够与高难度代理基准竞争。