谷歌的 Gemma 4 12B 刚刚发布 —— 下面教你如何在 Mac 上本地运行它
摘要
Google 发布了 Gemma 4 12B,这是一款基于 Apache 2.0 开源协议的多模态模型,支持文本、视觉和音频处理,上下文窗口达 256K。本文提供了一份指南,介绍如何在 Mac 上使用 Ollama、LM Studio 或 llama.cpp 本地运行该模型。
Google 今天发布了 Gemma 4 12B。它是一个可靠的开源模型(Apache 2.0),支持多模态,在配备 16GB 或更高统一内存的 Mac 上运行得非常好。擅长推理、编程和智能体任务。
Mac 友好信息速览
• 12B 参数,在 M2/M3/M4 Mac 上表现良好(尤其是 Q4/Q5 量化)
• 256K 上下文
• 支持文本、视觉和音频
最简单的运行方式:Ollama
1. 从 ollama.com 下载并安装 Ollama(Mac 应用非常简单)。或者你也可以使用 Homebrew。
2. 打开终端并拉取模型:ollama pull gemma4:12b
3. 运行:ollama run gemma4:12b
就这样。你可以立即开始聊天。
Mac 小贴士:
• Ollama 自动使用 Metal,因此在 Apple Silicon 上运行速度相当快。
• 16GB Mac 运行 12B 模型没问题。32GB 体验更佳。
• 如果你经常编程,与 VS Code 中的 Continue.dev 搭配使用效果很好。
如果 Ollama 不适合你,还有其他选择:LM Studio(界面友好),或者 llama.cpp(更可控)。
有人已经在本地尝试过图像或音频功能吗?在你的机器上运行速度如何?如果你测试过,请分享你的配置和结果。
相似文章
@googleaidevs: 我们正在发布Gemma 4 12B:这是一款统一的、无编码器的模型,将强大的多模态智能直接带到您的笔记本电脑上。
Google发布Gemma 4 12B,一款原生支持音频、无编码器的多模态模型,专为在笔记本电脑上本地运行而优化,采用Apache 2.0许可证。
@lmstudio: Gemma 4 12B 来了!一款紧凑的中型 Gemma 模型,可直接在你的笔记本上运行——由 @google 以 Apache 2.0 许可证发布…
Google 发布了 Gemma 4 12B,这是一款紧凑的中型模型,可在笔记本上运行,采用 Apache 2.0 许可证,现在已在 LM Studio 中可用。
谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行
谷歌发布Gemma 4 12B,这是一款紧凑型AI模型,专为仅需16GB RAM的本地笔记本使用而优化,具备多令牌预测以及针对文本、音频和图像的简化多模态能力。
Google Gemma 4 12B
谷歌的 Gemma 4 12B 模型通过无编码器架构实现本地多模态AI。
@UnslothAI:Gemma 4 12B 现在可以通过 Dynamic GGUFs 在仅 8GB 内存上本地运行。Google 的新模型 Gemma 4 12B Unified 支持图像…
Gemma 4 12B,Google 的多模态开放模型,支持图像、音频和 256K 上下文,现在可以通过 Unsloth 的 Dynamic GGUFs 在仅 8GB 内存上本地运行,并通过 Unsloth Studio 实现本地训练和推理。