直接在PC上运行Chrome的小型Gemma4（即Gemini Nano），无需GPU

Reddit r/LocalLLaMA 2026/05/23 18:10 工具

chrome-extension gemma4 gemini-nano local-ai on-device-ai vibe-coding open-source

摘要

一位开发者创建了一个名为Dobby的Chrome扩展程序，可以在PC上本地运行谷歌的Gemma4（Gemini Nano），无需GPU，只需Chrome和16GB内存。该扩展提供了一个简单的界面，用于与模型交互，完成拼写检查或摘要等任务。

大家都记得本月初悄悄下载的Gemini Nano吧？如果你和它对话，它会高兴地告诉你它是Gemma。由于一些朋友对此感兴趣，但又不愿意像通过锁眼对可怜的家养小精灵说话那样，通过开发者工具来与它交流，所以我花了5分钟编写了一个vibe编码的扩展来运行它。无需任何额外要求，只需要Google Chrome、16GB内存和一点磁盘空间。不需要llama.cpp、vllm等，也不用调整（我知道，这不好玩）。运行相当快且流畅，在我的笔记本上感觉大约20+t/s，没有GPU。不过我没有实际的速度数据。一切由Chrome处理。每个会话可用9216个token，由Chrome设定。模型完全在Chrome本地运行。用途……嗯，拼写检查，这样谷歌就不会知道我拼写有多差了？给长篇网络帖子做个快速摘要？只是好玩？总之，这里是一键添加扩展的链接：https://chromewebstore.google.com/detail/dobby/ehinjcinljpggpokocmkbcaedpjdbbbe?authuser=0&hl=en-GB&pli=1 或者如果你想稍微折腾一下，并且不想叫它Dobby（Chrome的家养小精灵），这是仓库：https://github.com/herryupmay/Dobby

查看原文

相似文章

@_ar9av: 所以谷歌似乎将 Gemini Nano 4B 大语言模型（上下文限制：9216 tokens）内置于 Chrome 中。我尝试将其暴露出来……

X AI KOLs Timeline

一位开发者发现谷歌将 Gemini Nano 4B 大语言模型内置到 Chrome 中，并创建了一个兼容 OpenAI 的 API 封装用于本地使用，无需 API 密钥或外部网络调用。

谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行

Ars Technica

谷歌发布Gemma 4 12B，这是一款紧凑型AI模型，专为仅需16GB RAM的本地笔记本使用而优化，具备多令牌预测以及针对文本、音频和图像的简化多模态能力。

谷歌的 Gemma 4 12B 刚刚发布 —— 下面教你如何在 Mac 上本地运行它

Reddit r/artificial

Google 发布了 Gemma 4 12B，这是一款基于 Apache 2.0 开源协议的多模态模型，支持文本、视觉和音频处理，上下文窗口达 256K。本文提供了一份指南，介绍如何在 Mac 上使用 Ollama、LM Studio 或 llama.cpp 本地运行该模型。

运行 gemma-4-26B-A4B 不需要 GPU

Reddit r/LocalLLaMA

作者展示了在仅使用 CPU 的系统上，通过 Koboldcpp 高效运行 Gemma-4-26B-A4B 模型，在一台旧台式机上达到了每秒 7 个 token 的速度，这表明运行本地大语言模型推理可能并不需要强大的 GPU。

@hank_aibtc: 猛啊！在浏览器里跑 Gemma 4，堪比 ChatGPT？！完全零服务器、零数据上传、离线使用、纯WebGPU本地推理！ Xenova把 Fable 5写的27个自定义WebGPU内核全部开源了： - Gemma 4 E2B（23亿参…