gemma

#gemma

MTP 下的质量较差 - Qwen 3.6, Gemma 4

Reddit r/LocalLLaMA ↗ · 13小时前

用户报告称，Qwen 3.6 和 Gemma 4 的 MTP 版本在代码审查任务中的输出质量低于非 MTP 版本，尽管其 token 生成速率更高，但实际速度提升微乎其微。

0 人收藏 0 人点赞

#gemma

@googledevs: 准备好将开放模型的力量带到你的社区了吗？@GoogleGemma 团队正在 @Kaggle 上赞助为期1天的黑客松活动……

X AI KOLs Following ↗ · 昨天缓存

Google Gemma团队正在赞助Kaggle上的1天黑客松活动，提供奖金支持，鼓励社区使用Gemma 4构建轻量级工具或推动AI创新。

0 人收藏 0 人点赞

#gemma

LLMs中的潜在对齐漏洞：来自Gemma-3-12B的行为与隐藏状态证据——指令调优LLMs中预令牌隐藏状态偏移作为对齐策略遍历向量

Reddit r/AI_Agents ↗ · 2天前

本文研究指令调优LLMs（特别是Gemma-3-12B）中的一个对齐漏洞，通过展示预令牌隐藏状态偏移可以作为对齐策略遍历向量，从而可能绕过安全措施。

0 人收藏 0 人点赞

#gemma

你在提问前阅读的内容会改变语言模型的回答方式——即使问题与你所读的内容完全无关。LLM中的潜在对齐漏洞：来自Gemma-3-12B的行为和隐藏状态证据

Reddit r/ArtificialInteligence ↗ · 2天前

文章报告了LLM中的一个潜在对齐漏洞：模型在处理一个结构化的段落之后，即使后续问题与段落内容完全无关，其回答也可能发生变化。来自Gemma-3-12B的机制证据显示了隐藏状态的分离。

0 人收藏 0 人点赞

#gemma

@iluciddreaming: Google 又干掉了一个创业公司…… Google AI Edge Eloquent 现已支持 Mac，完全本地的 Wispr Flow 替代品。基于最新 Gemma 模型，支持实时语音转录 + 语音命令编辑文本。免费、无订阅、无需…

X AI KOLs Timeline ↗ · 3天前缓存

Google AI Edge Eloquent 现已支持 Mac，作为完全本地的 Wispr Flow 替代品，基于最新 Gemma 模型实现实时语音转录和语音命令编辑文本，免费、无订阅且隐私全本地。

0 人收藏 0 人点赞

#gemma

我们使用本地模型免费对OpenClaw仓库进行问题分类！*

Hugging Face Blog ↗ · 3天前缓存

这篇博文介绍了在代理框架中使用Gemma、Qwen等本地开源权重模型，自动对OpenClaw仓库中的问题和拉取请求进行分类，从而实现实时通知，无需依赖昂贵的封闭API模型。

0 人收藏 0 人点赞

#gemma

最佳本地视觉模型——第二次基准测试更新——2026年6月21日

Reddit r/LocalLLaMA ↗ · 4天前

本文介绍了本地视觉语言模型基准测试的第二次更新，比较了23个模型在30张图像上的表现（使用修订设置），并为不同VRAM层级提供了性能建议。主要发现包括：推理模式会损害视觉性能，且MoE模型在感知任务上表现不如密集模型。

0 人收藏 0 人点赞

#gemma

huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated

Hugging Face Models Trending ↗ · 4天前缓存

通过abliteration技术去除拒绝机制的gemma-4-12B-coder模型的无审查版本，仅供研究和实验用途。

0 人收藏 0 人点赞

#gemma

@googledevs: 直接在笔记本电脑上使用 Google Gemma 开放模型部署本地编码代理 → https://goo.gle/gemma-ama-en 加入 Ian…

X AI KOLs Following ↗ · 6天前缓存

现在可以使用 Google Gemma 开放模型直接在笔记本电脑上部署本地编码代理，实现离线执行和更快的开发工作流程。

0 人收藏 0 人点赞

#gemma

@hank_aibtc: 猛啊！在浏览器里跑 Gemma 4，堪比 ChatGPT？！完全零服务器、零数据上传、离线使用、纯WebGPU本地推理！ Xenova把 Fable 5写的27个自定义WebGPU内核全部开源了： - Gemma 4 E2B（23亿参…

X AI KOLs Timeline ↗ · 2026-06-18 缓存

文章介绍了Xenova开源了27个自定义WebGPU内核，使得Gemma 4模型可以在浏览器中完全离线、本地运行，性能达到255 tok/s，并讨论了隐私、离线使用等优势。同时也提到了FLUX.2的3D生成能力。

0 人收藏 0 人点赞

#gemma

NAVI-Orbital: 面向自主地球观测的零样本视觉语言模型的首次在轨演示

arXiv cs.AI ↗ · 2026-06-18 缓存

NAVI-Orbital展示了零样本视觉语言模型（Gemma 3）在低地球轨道卫星上的首次在轨部署，无需微调即可实现自主场景分类和地球观测数据的语义压缩。

0 人收藏 0 人点赞

#gemma

本地模型从几乎无用迅速变得真正有用。是什么发生了变化？

Reddit r/LocalLLaMA ↗ · 2026-06-17

文章指出，过去一年中，本地AI模型变得显著更有用，从玩具变成了编程和工作流程的实用工具，尽管在复杂任务上仍落后于闭源模型。

0 人收藏 0 人点赞

#gemma

Gemma拒绝伤害船员——直到我告诉它场景是假设的

Reddit r/ArtificialInteligence ↗ · 2026-06-16

用户使用类似电车难题的道德困境测试Gemma-4-e4b本地模型，发现当场景被设定为假设时，模型拒绝伤害船员的态度发生转变，这引发了关于提示敏感性与实际推理能力之间关系的疑问。

0 人收藏 0 人点赞

#gemma

咳 gemma3 270M 咳

Reddit r/LocalLLaMA ↗ · 2026-06-15

谷歌发布了Gemma 3，一个270M参数的语言模型。

0 人收藏 0 人点赞

#gemma

如何复制自己的写作风格

Reddit r/LocalLLaMA ↗ · 2026-06-15

用户询问，在本地LLM中提供其写作风格的样本，是放在对话中更有效，还是放在系统提示中更有效。

0 人收藏 0 人点赞

#gemma

@iluciddreaming: 玩了两个月本地 LLM。用 Windows 11 + llama.cpp + llama-swap 狂测各种开源模型，这是我的最终成绩单：硬件：i7-13700 + 64GB RAM + RTX 4070 目前最能打的组合是 gemm…

X AI KOLs Timeline ↗ · 2026-06-15 缓存

经过两个月本地 LLM 测试，作者认为 gemma-4-12B-it-QAT 和 MTP 辅助组合在速度和可用性上表现最佳，硬件为 i7-13700 + 64GB RAM + RTX 4070。

0 人收藏 0 人点赞

#gemma

React Native ExecuTorch 现已支持 Gemma 4（Vulkan 和 MLX 加速）

Reddit r/LocalLLaMA ↗ · 2026-06-15

react-native-executorch 库现已集成 Google 的 Gemma 4 模型，可实现完全离线的 GPU 加速推理，在 Android 上使用 Vulkan 委托，在 Apple Silicon 上使用 MLX 委托。

0 人收藏 0 人点赞

#gemma

打造出一款能创建高度个性化 macOS 应用的 macOS 应用，支持 Gemma 4 E2B 等小模型

Reddit r/LocalLLaMA ↗ · 2026-06-15

Ironsmith 是一款开源 macOS 应用，只需一个提示即可生成本地 macOS 应用，使用 Gemma 4 等本地 AI 模型，能在 8GB MacBook Air 等低端硬件上运行。

0 人收藏 0 人点赞

#gemma

Gemma 12b 低于10瓦 6.5pp 1.3tg

Reddit r/LocalLLaMA ↗ · 2026-06-14

在Google Pixel 10 Pro上使用llama.cpp运行Gemma 12B模型，实现了每秒6.5个token的提示处理和每秒1.3个token的生成，功耗低于10瓦，展示了高效的设备端AI推理。

0 人收藏 0 人点赞

#gemma

Qwen 3.6 35B-A3B @ Q4 还是 Gemma 4 12B @ Q8？

Reddit r/LocalLLaMA ↗ · 2026-06-14

用户就如何在 Q4 量化的 Qwen 3.6 35B-A3B 和 Q8 量化的 Gemma 4 12B 之间做出选择征求意见，用于本地代码库工作，设备为 32GB 统一内存。

0 人收藏 0 人点赞

gemma

提交意见反馈