@MiaAI_lab: Orinth-1.0-35b MoE 看起来比 Qwen 3.6 35b 好得多,特别是在 Terminal-Bench 2.1 和 SWE Atlas 上。

X AI KOLs Timeline 模型

摘要

Orinth-1.0-35b MoE 在 Terminal-Bench 2.1 和 SWE Atlas 基准测试上优于 Qwen 3.6 35b。

Orinth-1.0-35b MoE 看起来比 Qwen 3.6 35b 好得多,特别是在 Terminal-Bench 2.1 和 SWE Atlas 上。https://t.co/dDt2GZjxuO
查看原文
查看缓存全文

缓存时间: 2026/06/26 12:11

Orinth-1.0-35b MoE 明显优于 Qwen 3.6 35b,尤其在 Terminal-Bench 2.1 和 SWE Atlas 上表现出色。https://t.co/dDt2GZjxuO

相似文章

Qwen 3.6 35B A3B 的热度绝非虚名!

Reddit r/LocalLLaMA

作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。

4x RTX 3090 上的 Qwen3.5-27B、Qwen3.5-122B 和 Qwen3.6-35B —— MoE 模型在严格全局规则下的表现困境

Reddit r/LocalLLaMA

潜水多年的老用户,首次发帖。在 4 张 RTX 3090 上对三款 Qwen 模型分别进行了 20 多个会话的实时智能体工作测试——**Qwen3.5-27B** 稠密模型、**Qwen3.5-122B-A10B** MoE 和 **Qwen3.6-35B-A3B** MoE。以下数据均解析自持续真实负载下的 vLLM 日志,而非合成基准测试。**本文所有数据的关键负载背景:** 测试框架是一个多智能体编排器,同时运行 1-6 个并发的 OpenCode 会话,Prompt 长度为 30-60k token,并且强制执行**严格的 Bash 允许列表