Qwen3.7 Max在Artificial Analysis评测中得分,27B/35B等待室

Reddit r/LocalLLaMA 模型

摘要

Qwen3.7 Max在Artificial Analysis基准测试中排名第五,与GPT-5.4持平,并超越了刚发布的Gemini 3.5 Flash,而Qwen3.6 27B则明显落后。

https://preview.redd.it/42ak5qmus82h1.png?width=1133&format=png&auto=webp&s=744ea3dfc06c83d0c4d8aa128c39b3238b17d7be Qwen 3.7 Max位列第五,与GPT 5.4 (xhigh)基本持平,略高于刚发布的Gemini 3.5 Flash。在另一端,我们看到DSV4 Flash和Qwen3.6 27B,后者比其最大版本正好落后6分。希望Qwen3.7也能与其最大版大哥处于同一水平。
查看原文

相似文章

Qwen3.7:智能代理前沿(15分钟阅读)

TLDR AI

阿里巴巴Qwen团队发布了Qwen3.7-Max,这是一款专有智能代理基础模型,在Terminal-Bench 2.0、SWE-Pro、GPQA Diamond等多个基准测试中取得最高分,并在多种代码环境中表现一致。