Gemma 4 26b 为何不受关注?

Reddit r/LocalLLaMA 模型

摘要

一位用户询问为什么 Gemma 4 26b 相比 Qwen 模型关注度较低,并分享了他们在 3090 上使用这些模型构建个人助手项目的经验。

本论坛上大多数问题的答案都是 Qwen3.6 27b 或 35b,然后是 Gemma4 31b(但提及较少,因为它不太适合单张 3090)。为什么 Gemma 4 26b moe 没有被更多地提及?我计划将 Qwen 用于我的编码代理。但我一直在为自己构建一个 Jarvis,它是一个大型一体化 RAG、个人助手等,运行在我的单张 3090 上(还有一些辅助 GPU 来支持较小的模型)。我曾将 qwen3.6 35b 作为主要驱动模型。但经过更多测试,我认为 Gemma 可能更适合这类任务。我唯一的警示信号是,现在很少有人再讨论它了。为什么 Gemma 4 26b 缺乏关注?它有哪些不为人知的缺点?
查看原文

相似文章

Gemma 4 12B 是我的新主力

Reddit r/LocalLLaMA

作者分享了从 Qwen 3.6 切换到 Gemma 4 12B(Unsloth Q5_K_XL)进行本地编程的体验,称赞其即插即用的设置、更好的语法准确性以及可控的 VRAM 使用,尽管在速度上略有取舍。

Gemma 4 31B 的能力让我惊讶

Reddit r/LocalLLaMA

一位用户分享了轶事发现:Gemma 4 31B 在理解和重构杂乱的学术代码方面优于 Qwen 3.6 模型,并与 Opus 4.7 能力相当,还突出了一个 Gemma 擅长的基准测试(SciCode)。