谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行

Ars Technica 2026/06/03 19:10 模型

google gemma-4 small-model local-inference multimodal open-source on-device

摘要

谷歌发布Gemma 4 12B，这是一款紧凑型AI模型，专为仅需16GB RAM的本地笔记本使用而优化，具备多令牌预测以及针对文本、音频和图像的简化多模态能力。

生成式AI的繁荣将内存成本推向了天价，而谷歌正是这一趋势的关键推动者。因此，谷歌推出一些内存需求较低的本地AI模型也是合情合理的。该公司宣布发布一款新的Gemma 4模型，填补了今年早些时候推出的产品线中的空白。这款新模型非常高效，以至于你或许能在相当普通的消费级笔记本电脑上运行它。 今年四月，谷歌发布了Gemma 4系列中的四款模型，这也标志着向更开放的Apache 2.0许可的转变。最初的模型包括两个移动端优化版本（E2B和E4B）以及两款用于更严肃工作的模型（26B混合专家模型和31B密集模型）。这在中端留下了一个相当大的未服务空间，而新模型正好填补了这个空缺。 Gemma 4 12B比移动版本强大得多，但运行本地时不需要价值2万美元的AI加速器。谷歌表示，Gemma 4 12B的独特之处在于它可以在许多消费级笔记本电脑上运行而不牺牲质量。只要你有一台拥有16GB系统内存或显存的电脑，这个120亿参数的模型就能运行。这大约是Gemma 4 26B MoE总内存占用量的一半，而谷歌声称新模型的能力几乎相当，至少在基准测试方面是这样。<a href="https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/">阅读全文</a> <a href="https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/#comments">评论</a>

查看原文

查看缓存全文

缓存时间: 2026/06/03 21:41

# 谷歌新推出的Gemma 4 12B模型专为任何拥有16GB内存的笔记本电脑设计来源：https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/ Gemma 4基准测试图（https://cdn.arstechnica.net/wp-content/uploads/2026/06/1920x1080_xMVEyWv.width-1000.format-webp.png） Gemma 4 12B的性能几乎与拥有260亿参数的版本相当。图片来源：Google 谷歌表示，新模型能够进行复杂的多步骤推理和代理工作流，这些以前需要更大的Gemma变体才能完成。尽管参数数量更小，Gemma 4 12B配备了新设计的Multi-Token Prediction（MTP）预演器（https://arstechnica.com/ai/2026/05/googles-gemma-4-open-ai-models-use-speculative-decoding-to-get-up-to-3x-faster/），它利用未使用的处理周期来计算可能的未来token。结果是更高的速度和效率。谷歌已经发布了其他Gemma 4模型的可选MTP版本，但这是第一个默认集成MTP的模型。 Gemma 4 12B还因一种新的多模态方法而更加高效。Gemma 4系列原生支持多模态，接受文本、音频或图像作为输入。大多数生成式AI模型——包括其他Gemma 4变体——使用专门的编码器处理非文本输入并将数据传递给LLM。这效果不错，但会增加延迟和内存使用。对于新的中等规模模型，谷歌实现了一个简化的视觉嵌入模块，采用单矩阵乘法和位置嵌入，使得数据能够以适当的空间感知传递给LLM。这消除了对庞大中间编码器的需求。对于音频，则完全没有编码。开发人员找到了一种方法，将原始音频信号投射到用于文本token的相同向量中。 ## Gemma 4 12B Demo 如果你想查看新的Gemma 4模型，可以通过LM Studio（https://lmstudio.ai/models/gemma-4）、Google AI Edge Gallery（https://developers.google.com/edge/gallery）等工具无需下载直接访问。但Gemma 4 12B的核心理念是你可以本地运行它，并按自己的方式使用。如果你有足够的内存，模型权重可以立即在Kaggle（https://huggingface.co/collections/google/gemma-4）和Hugging Face（https://huggingface.co/collections/google/gemma-4）上下载。它的大小略低于18GB。

谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行

相似文章

@KanikaBK: Google刚刚投下了一颗AI重磅炸弹！一场十亿美元的游戏开始了。Gemma 4 12B在你的笔记本电脑上运行。16GB内存，那就是……

@UnslothAI：Gemma 4 12B 现在可以通过 Dynamic GGUFs 在仅 8GB 内存上本地运行。Google 的新模型 Gemma 4 12B Unified 支持图像…

@googleaidevs: 我们正在发布Gemma 4 12B：这是一款统一的、无编码器的模型，将强大的多模态智能直接带到您的笔记本电脑上。

推出 Gemma 3

@JulianGoldieSEO: Google 刚刚将本地 AI 的速度提升了 3 倍，且完全免费。Gemma 4 现在在普通笔记本电脑上的运行速度已足够快，让本地 AI 终于变得……

提交意见反馈