Gemma 4 26b a4b 确实是我尝试过的最适合语言学习和科学查询的模型!

Reddit r/LocalLLaMA 模型

摘要

用户报告称,Gemma 4 26b 在语言学习和科学查询方面优于 Qwen 3.5/3.6,尽管在编码任务上稍显逊色,并邀请大家讨论小型 MoE 模型在编码以外的其他用例。

我知道 Gemma 4 26b(根据这个社区的说法)在编码任务上稍逊一筹,但在语言学习和科学(健康/生物/医学/临床/生化)查询方面,它甚至比 Qwen 3.5/3.6 都无可匹敌。既然小型 MoE 模型的竞争主要在 Qwen 3.5/3.6 和 Gemma 4 之间,我想知道这里谁有编码和角色扮演以外的用例,以及哪个模型在你的用例中更胜一筹?真希望除了 20b 到 30b 之间的小型 MoE 模型能再多一些(35b 就有点勉强了哈哈)。显然,编码和智能体任务是本社区的主要关注点,但我们很多人也有其他常见和冷门的用例,所以我非常乐意听听你们的!
查看原文

相似文章

Gemma 4 31B 的能力让我惊讶

Reddit r/LocalLLaMA

一位用户分享了轶事发现:Gemma 4 31B 在理解和重构杂乱的学术代码方面优于 Qwen 3.6 模型,并与 Opus 4.7 能力相当,还突出了一个 Gemma 擅长的基准测试(SciCode)。

Qwen 35b a3b 令我惊喜

Reddit r/LocalLLaMA

用户报告了使用 Qwen 35b a3b 进行代理编码任务的积极体验,指出在其使用场景中它优于 Gemma4 26b,并且在演示/数据分析方面表现出色,尤其是在代理模式而非聊天模式下。

Gemma 4 12B 是我的新主力

Reddit r/LocalLLaMA

作者分享了从 Qwen 3.6 切换到 Gemma 4 12B(Unsloth Q5_K_XL)进行本地编程的体验,称赞其即插即用的设置、更好的语法准确性以及可控的 VRAM 使用,尽管在速度上略有取舍。