谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行
摘要
谷歌发布Gemma 4 12B,这是一款紧凑型AI模型,专为仅需16GB RAM的本地笔记本使用而优化,具备多令牌预测以及针对文本、音频和图像的简化多模态能力。
<p>生成式AI的繁荣将内存成本推向了天价,而谷歌正是这一趋势的关键推动者。因此,谷歌推出一些内存需求较低的本地AI模型也是合情合理的。该公司宣布发布一款新的Gemma 4模型,填补了今年早些时候推出的产品线中的空白。这款新模型非常高效,以至于你或许能在相当普通的消费级笔记本电脑上运行它。</p>
<p>今年四月,谷歌发布了Gemma 4系列中的四款模型,这也标志着向更开放的Apache 2.0许可的转变。最初的模型包括两个移动端优化版本(E2B和E4B)以及两款用于更严肃工作的模型(26B混合专家模型和31B密集模型)。这在中端留下了一个相当大的未服务空间,而新模型正好填补了这个空缺。</p>
<p>Gemma 4 12B比移动版本强大得多,但运行本地时不需要价值2万美元的AI加速器。谷歌表示,Gemma 4 12B的独特之处在于它可以在许多消费级笔记本电脑上运行而不牺牲质量。只要你有一台拥有16GB系统内存或显存的电脑,这个120亿参数的模型就能运行。这大约是Gemma 4 26B MoE总内存占用量的一半,而谷歌声称新模型的能力几乎相当,至少在基准测试方面是这样。</p><p><a href="https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/">阅读全文</a></p>
<p><a href="https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/#comments">评论</a></p>
查看缓存全文
缓存时间: 2026/06/03 21:41
# 谷歌新推出的Gemma 4 12B模型专为任何拥有16GB内存的笔记本电脑设计
来源:https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/
Gemma 4基准测试图(https://cdn.arstechnica.net/wp-content/uploads/2026/06/1920x1080_xMVEyWv.width-1000.format-webp.png)
Gemma 4 12B的性能几乎与拥有260亿参数的版本相当。
图片来源:Google
谷歌表示,新模型能够进行复杂的多步骤推理和代理工作流,这些以前需要更大的Gemma变体才能完成。尽管参数数量更小,Gemma 4 12B配备了新设计的Multi-Token Prediction(MTP)预演器(https://arstechnica.com/ai/2026/05/googles-gemma-4-open-ai-models-use-speculative-decoding-to-get-up-to-3x-faster/),它利用未使用的处理周期来计算可能的未来token。结果是更高的速度和效率。谷歌已经发布了其他Gemma 4模型的可选MTP版本,但这是第一个默认集成MTP的模型。
Gemma 4 12B还因一种新的多模态方法而更加高效。Gemma 4系列原生支持多模态,接受文本、音频或图像作为输入。大多数生成式AI模型——包括其他Gemma 4变体——使用专门的编码器处理非文本输入并将数据传递给LLM。这效果不错,但会增加延迟和内存使用。
对于新的中等规模模型,谷歌实现了一个简化的视觉嵌入模块,采用单矩阵乘法和位置嵌入,使得数据能够以适当的空间感知传递给LLM。这消除了对庞大中间编码器的需求。对于音频,则完全没有编码。开发人员找到了一种方法,将原始音频信号投射到用于文本token的相同向量中。
## Gemma 4 12B Demo
如果你想查看新的Gemma 4模型,可以通过LM Studio(https://lmstudio.ai/models/gemma-4)、Google AI Edge Gallery(https://developers.google.com/edge/gallery)等工具无需下载直接访问。但Gemma 4 12B的核心理念是你可以本地运行它,并按自己的方式使用。如果你有足够的内存,模型权重可以立即在Kaggle(https://huggingface.co/collections/google/gemma-4)和Hugging Face(https://huggingface.co/collections/google/gemma-4)上下载。它的大小略低于18GB。
相似文章
@KanikaBK: Google刚刚投下了一颗AI重磅炸弹!一场十亿美元的游戏开始了。Gemma 4 12B在你的笔记本电脑上运行。16GB内存,那就是……
Google发布了Gemma 4 12B,这是一个采用Apache 2.0许可证的开源多模态AI模型,可在拥有16GB内存的笔记本电脑上本地运行,面向企业边缘部署。
@UnslothAI:Gemma 4 12B 现在可以通过 Dynamic GGUFs 在仅 8GB 内存上本地运行。Google 的新模型 Gemma 4 12B Unified 支持图像…
Gemma 4 12B,Google 的多模态开放模型,支持图像、音频和 256K 上下文,现在可以通过 Unsloth 的 Dynamic GGUFs 在仅 8GB 内存上本地运行,并通过 Unsloth Studio 实现本地训练和推理。
@googleaidevs: 我们正在发布Gemma 4 12B:这是一款统一的、无编码器的模型,将强大的多模态智能直接带到您的笔记本电脑上。
Google发布Gemma 4 12B,一款原生支持音频、无编码器的多模态模型,专为在笔记本电脑上本地运行而优化,采用Apache 2.0许可证。
推出 Gemma 3
Google 推出了 Gemma 3,这是一套轻量级开源模型集合(1B、4B、12B、27B),设计用于在单个 GPU 或 TPU 上运行,支持 140+ 种语言、128k 上下文窗口和多模态功能。这些模型在保持高效性能的同时,性能超越了 Llama 3 和 DeepSeek-V3 等更大的竞品,适合边缘设备部署。
@JulianGoldieSEO: Google 刚刚将本地 AI 的速度提升了 3 倍,且完全免费。Gemma 4 现在在普通笔记本电脑上的运行速度已足够快,让本地 AI 终于变得……
Google 发布了 Gemma 4,这是一个针对标准笔记本电脑进行本地执行优化的开源 AI 模型,在 Apache 2.0 许可证下免费提供 3 倍性能提升和 256k 上下文窗口。