谷歌的 Gemma 4 12B 刚刚发布 —— 下面教你如何在 Mac 上本地运行它

Reddit r/artificial 2026/06/04 14:32 模型

open-source multimodal local-inference apple-silicon gemma llm on-device-ai

摘要

Google 发布了 Gemma 4 12B，这是一款基于 Apache 2.0 开源协议的多模态模型，支持文本、视觉和音频处理，上下文窗口达 256K。本文提供了一份指南，介绍如何在 Mac 上使用 Ollama、LM Studio 或 llama.cpp 本地运行该模型。

Google 今天发布了 Gemma 4 12B。它是一个可靠的开源模型（Apache 2.0），支持多模态，在配备 16GB 或更高统一内存的 Mac 上运行得非常好。擅长推理、编程和智能体任务。 Mac 友好信息速览 • 12B 参数，在 M2/M3/M4 Mac 上表现良好（尤其是 Q4/Q5 量化） • 256K 上下文 • 支持文本、视觉和音频最简单的运行方式：Ollama 1. 从 ollama.com 下载并安装 Ollama（Mac 应用非常简单）。或者你也可以使用 Homebrew。 2. 打开终端并拉取模型：ollama pull gemma4:12b 3. 运行：ollama run gemma4:12b 就这样。你可以立即开始聊天。 Mac 小贴士： • Ollama 自动使用 Metal，因此在 Apple Silicon 上运行速度相当快。 • 16GB Mac 运行 12B 模型没问题。32GB 体验更佳。 • 如果你经常编程，与 VS Code 中的 Continue.dev 搭配使用效果很好。如果 Ollama 不适合你，还有其他选择：LM Studio（界面友好），或者 llama.cpp（更可控）。有人已经在本地尝试过图像或音频功能吗？在你的机器上运行速度如何？如果你测试过，请分享你的配置和结果。

查看原文

谷歌的 Gemma 4 12B 刚刚发布 —— 下面教你如何在 Mac 上本地运行它

相似文章

@googleaidevs: 我们正在发布Gemma 4 12B：这是一款统一的、无编码器的模型，将强大的多模态智能直接带到您的笔记本电脑上。

@lmstudio: Gemma 4 12B 来了！一款紧凑的中型 Gemma 模型，可直接在你的笔记本上运行——由 @google 以 Apache 2.0 许可证发布…

谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行

Google Gemma 4 12B

@UnslothAI：Gemma 4 12B 现在可以通过 Dynamic GGUFs 在仅 8GB 内存上本地运行。Google 的新模型 Gemma 4 12B Unified 支持图像…

提交意见反馈