gemma

#gemma

Google 的量化感知训练 Gemma 检查点已在 HuggingFace 上发布，支持移动设备推理

Reddit r/singularity ↗ · 2026-06-05

Google 在 HuggingFace 上发布了经过量化感知训练的 Gemma 4 检查点，针对移动设备推理进行了优化，并提供 QAT Mobile 和 Q4_0 两种变体。

0 人收藏 0 人点赞

#gemma

谷歌的 Gemma 4 12B 刚刚发布 —— 下面教你如何在 Mac 上本地运行它

Reddit r/artificial ↗ · 2026-06-04

Google 发布了 Gemma 4 12B，这是一款基于 Apache 2.0 开源协议的多模态模型，支持文本、视觉和音频处理，上下文窗口达 256K。本文提供了一份指南，介绍如何在 Mac 上使用 Ollama、LM Studio 或 llama.cpp 本地运行该模型。

0 人收藏 0 人点赞

#gemma

Gemma 4 QAT 确认即将发布！

Reddit r/LocalLLaMA ↗ · 2026-06-04

一位 Google Gemma 团队成员证实，Gemma 4 QAT（量化感知训练）模型即将发布，建议用户等待后再测试自己的量化版本。

0 人收藏 0 人点赞

#gemma

昨天在我的3090上跑了gemma 4 12b，我觉得本地模型领域已经变了

Reddit r/artificial ↗ · 2026-06-04

一位用户报告称，通过GGUF量化在单张RTX 3090上本地运行了谷歌的Gemma 4 12B模型，发现其性能强劲，包括真实的256k上下文、多模态能力以及函数调用功能，在编码任务上甚至优于更大的70B模型。

0 人收藏 0 人点赞

#gemma

Gemma4 12B 更新

Reddit r/LocalLLaMA ↗ · 2026-06-03

Google 的 Gemma4-12B 模型权重在 HuggingFace 上已静默更新；更新原因不明，但可能涉及修复。

0 人收藏 0 人点赞

#gemma

@googleaidevs: 我们正在发布Gemma 4 12B：这是一款统一的、无编码器的模型，将强大的多模态智能直接带到您的笔记本电脑上。

X AI KOLs Timeline ↗ · 2026-06-03 缓存

Google发布Gemma 4 12B，一款原生支持音频、无编码器的多模态模型，专为在笔记本电脑上本地运行而优化，采用Apache 2.0许可证。

0 人收藏 0 人点赞

#gemma

@laobaishare: 这太牛逼了。谷歌刚甩出一款免费 AI 语音听写应用，支持 iOS 和 Mac。所有付费功能全部解锁，不用订阅。 100% 免费，完全本地运行，由 Gemma 4 驱动。这里下载： https://ai.google.dev/edg…

X AI KOLs Timeline ↗ · 2026-06-03 缓存

谷歌推出一款免费AI语音听写应用，由Gemma 4驱动，支持iOS和Mac，完全本地运行，无需订阅。

0 人收藏 0 人点赞

#gemma

@googlegemma: AI 视频编辑器无法编辑未索引的内容。了解开发者如何在五年前的笔记本电脑上本地使用 Gemma 4 31B 处理……

X AI KOLs Following ↗ · 2026-06-02 缓存

一名开发者在五年前的笔记本电脑上使用 Gemma 4 31B 处理并索引了一整年的原始视频，使其完全可搜索，展示了本地优先 AI 工具的潜力。

0 人收藏 0 人点赞

#gemma

@googlegemma: gemma-skills 首个版本正式发布！它支持使用 Gemma 构建智能体，包括利用 MTP 来提高速度并选择合适大小的模型。

X AI KOLs Timeline ↗ · 2026-06-01 缓存

Google 发布了 gemma-skills，这是一款帮助开发者使用 Gemma 模型构建智能体的工具，支持通过 MTP 提升速度，并能灵活选择模型尺寸。

0 人收藏 0 人点赞

#gemma

@UnslothAI：我们编写了一份关于在本地LLM中使用MCP的指南。连接Qwen3.6和Gemma 4，实现对工具、文件、API等的受控访问……

X AI KOLs Timeline ↗ · 2026-06-01 缓存

一份逐步指南，介绍如何通过Unsloth和llama.cpp在Qwen3.6和Gemma 4等本地LLM中使用MCP服务器，从而利用工具、文件及API实现私有的自动化工作流。

0 人收藏 0 人点赞

#gemma

@_philschmid: 我们为 Gemma 创建并使用了一个技能。 ``` npx skills add google-gemma/gemma-skills --skill gemma-dev ```

X AI KOLs Timeline ↗ · 2026-06-01 缓存

一个使用Google Gemma模型的技能已被创建，可通过npx安装。

0 人收藏 0 人点赞

#gemma

Qwen3.6-35B 与 Gemma4-26B 在 7900 XTX 上的对比

Reddit r/LocalLLaMA ↗ · 2026-05-31

一项详细的基准测试对比了 Radeon 7900 XTX 上的 Qwen3.6-35B 和 Gemma4-26B，结果显示尽管 Gemma 的 token 生成速度较慢，但端到端快了约 20%，原因是 Qwen 因内部推理生成了约两倍的 token。文章建议：在吞吐量受限的批量任务中使用 Qwen，在延迟敏感的单次请求中使用 Gemma。

0 人收藏 0 人点赞

#gemma