更多Gemma 4模型即将推出
摘要
谷歌宣布即将推出更多Gemma 4模型,可能包含一个120B参数的模型。
[https://x.com/i/status/2062237998415069224](https://x.com/i/status/2062237998415069224) 可能包含120B模型
相似文章
推出 Gemma 3
Google 推出了 Gemma 3,这是一套轻量级开源模型集合(1B、4B、12B、27B),设计用于在单个 GPU 或 TPU 上运行,支持 140+ 种语言、128k 上下文窗口和多模态功能。这些模型在保持高效性能的同时,性能超越了 Llama 3 和 DeepSeek-V3 等更大的竞品,适合边缘设备部署。
google/gemma-4-26B-A4B-it
Google DeepMind 发布 Gemma 4,一系列开放权重的多模态模型,参数量从2.3B到31B,支持文本、图像、视频和音频输入。模型具有256K上下文窗口,MoE和密集架构,增强的推理能力,并针对从移动设备到服务器的部署进行优化。
Gemma 4:同等参数规模下能力最强的开源模型
Google DeepMind 发布 Gemma 4,这是其迄今为止能力最强的开源模型系列,专为高级推理和智能体工作流设计,在多种参数规模下均实现了极高的智能密度。
Gemma4 12B 更新
Google 的 Gemma4-12B 模型权重在 HuggingFace 上已静默更新;更新原因不明,但可能涉及修复。
Gemma 4 Unified 即将发布
llama.cpp 中的一个合并的 PR 实现了一种新的 'Gemma 4 Unified' 模型类型,表明 Google 即将发布一个无 Transformer 的视觉塔模型。