更多Gemma 4模型即将推出

Reddit r/LocalLLaMA 模型

摘要

谷歌宣布即将推出更多Gemma 4模型,可能包含一个120B参数的模型。

[https://x.com/i/status/2062237998415069224](https://x.com/i/status/2062237998415069224) 可能包含120B模型
查看原文

相似文章

推出 Gemma 3

Google DeepMind Blog

Google 推出了 Gemma 3,这是一套轻量级开源模型集合(1B、4B、12B、27B),设计用于在单个 GPU 或 TPU 上运行,支持 140+ 种语言、128k 上下文窗口和多模态功能。这些模型在保持高效性能的同时,性能超越了 Llama 3 和 DeepSeek-V3 等更大的竞品,适合边缘设备部署。

google/gemma-4-26B-A4B-it

Hugging Face Models Trending

Google DeepMind 发布 Gemma 4,一系列开放权重的多模态模型,参数量从2.3B到31B,支持文本、图像、视频和音频输入。模型具有256K上下文窗口,MoE和密集架构,增强的推理能力,并针对从移动设备到服务器的部署进行优化。

Gemma4 12B 更新

Reddit r/LocalLLaMA

Google 的 Gemma4-12B 模型权重在 HuggingFace 上已静默更新;更新原因不明,但可能涉及修复。

Gemma 4 Unified 即将发布

Reddit r/LocalLLaMA

llama.cpp 中的一个合并的 PR 实现了一种新的 'Gemma 4 Unified' 模型类型,表明 Google 即将发布一个无 Transformer 的视觉塔模型。