gemma

标签

Cards List
#gemma

MTP 下的质量较差 - Qwen 3.6, Gemma 4

Reddit r/LocalLLaMA · 13小时前

用户报告称,Qwen 3.6 和 Gemma 4 的 MTP 版本在代码审查任务中的输出质量低于非 MTP 版本,尽管其 token 生成速率更高,但实际速度提升微乎其微。

0 人收藏 0 人点赞
#gemma

@googledevs: 准备好将开放模型的力量带到你的社区了吗?@GoogleGemma 团队正在 @Kaggle 上赞助为期1天的黑客松活动……

X AI KOLs Following · 昨天 缓存

Google Gemma团队正在赞助Kaggle上的1天黑客松活动,提供奖金支持,鼓励社区使用Gemma 4构建轻量级工具或推动AI创新。

0 人收藏 0 人点赞
#gemma

LLMs中的潜在对齐漏洞:来自Gemma-3-12B的行为与隐藏状态证据——指令调优LLMs中预令牌隐藏状态偏移作为对齐策略遍历向量

Reddit r/AI_Agents · 2天前

本文研究指令调优LLMs(特别是Gemma-3-12B)中的一个对齐漏洞,通过展示预令牌隐藏状态偏移可以作为对齐策略遍历向量,从而可能绕过安全措施。

0 人收藏 0 人点赞
#gemma

你在提问前阅读的内容会改变语言模型的回答方式——即使问题与你所读的内容完全无关。LLM中的潜在对齐漏洞:来自Gemma-3-12B的行为和隐藏状态证据

Reddit r/ArtificialInteligence · 2天前

文章报告了LLM中的一个潜在对齐漏洞:模型在处理一个结构化的段落之后,即使后续问题与段落内容完全无关,其回答也可能发生变化。来自Gemma-3-12B的机制证据显示了隐藏状态的分离。

0 人收藏 0 人点赞
#gemma

@iluciddreaming: Google 又干掉了一个创业公司…… Google AI Edge Eloquent 现已支持 Mac,完全本地的 Wispr Flow 替代品。 基于最新 Gemma 模型,支持实时语音转录 + 语音命令编辑文本。 免费、无订阅、无需…

X AI KOLs Timeline · 3天前 缓存

Google AI Edge Eloquent 现已支持 Mac,作为完全本地的 Wispr Flow 替代品,基于最新 Gemma 模型实现实时语音转录和语音命令编辑文本,免费、无订阅且隐私全本地。

0 人收藏 0 人点赞
#gemma

我们使用本地模型免费对OpenClaw仓库进行问题分类!*

Hugging Face Blog · 3天前 缓存

这篇博文介绍了在代理框架中使用Gemma、Qwen等本地开源权重模型,自动对OpenClaw仓库中的问题和拉取请求进行分类,从而实现实时通知,无需依赖昂贵的封闭API模型。

0 人收藏 0 人点赞
#gemma

最佳本地视觉模型——第二次基准测试更新——2026年6月21日

Reddit r/LocalLLaMA · 4天前

本文介绍了本地视觉语言模型基准测试的第二次更新,比较了23个模型在30张图像上的表现(使用修订设置),并为不同VRAM层级提供了性能建议。主要发现包括:推理模式会损害视觉性能,且MoE模型在感知任务上表现不如密集模型。

0 人收藏 0 人点赞
#gemma

huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated

Hugging Face Models Trending · 4天前 缓存

通过abliteration技术去除拒绝机制的gemma-4-12B-coder模型的无审查版本,仅供研究和实验用途。

0 人收藏 0 人点赞
#gemma

@googledevs: 直接在笔记本电脑上使用 Google Gemma 开放模型部署本地编码代理 → https://goo.gle/gemma-ama-en 加入 Ian…

X AI KOLs Following · 6天前 缓存

现在可以使用 Google Gemma 开放模型直接在笔记本电脑上部署本地编码代理,实现离线执行和更快的开发工作流程。

0 人收藏 0 人点赞
#gemma

@hank_aibtc: 猛啊!在浏览器里跑 Gemma 4,堪比 ChatGPT?! 完全零服务器、零数据上传、离线使用、纯WebGPU本地推理! Xenova把 Fable 5写的27个自定义WebGPU内核 全部开源了: - Gemma 4 E2B(23亿参…

X AI KOLs Timeline · 2026-06-18 缓存

文章介绍了Xenova开源了27个自定义WebGPU内核,使得Gemma 4模型可以在浏览器中完全离线、本地运行,性能达到255 tok/s,并讨论了隐私、离线使用等优势。同时也提到了FLUX.2的3D生成能力。

0 人收藏 0 人点赞
#gemma

NAVI-Orbital: 面向自主地球观测的零样本视觉语言模型的首次在轨演示

arXiv cs.AI · 2026-06-18 缓存

NAVI-Orbital展示了零样本视觉语言模型(Gemma 3)在低地球轨道卫星上的首次在轨部署,无需微调即可实现自主场景分类和地球观测数据的语义压缩。

0 人收藏 0 人点赞
#gemma

本地模型从几乎无用迅速变得真正有用。是什么发生了变化?

Reddit r/LocalLLaMA · 2026-06-17

文章指出,过去一年中,本地AI模型变得显著更有用,从玩具变成了编程和工作流程的实用工具,尽管在复杂任务上仍落后于闭源模型。

0 人收藏 0 人点赞
#gemma

Gemma拒绝伤害船员——直到我告诉它场景是假设的

Reddit r/ArtificialInteligence · 2026-06-16

用户使用类似电车难题的道德困境测试Gemma-4-e4b本地模型,发现当场景被设定为假设时,模型拒绝伤害船员的态度发生转变,这引发了关于提示敏感性与实际推理能力之间关系的疑问。

0 人收藏 0 人点赞
#gemma

*咳* gemma3 270M *咳*

Reddit r/LocalLLaMA · 2026-06-15

谷歌发布了Gemma 3,一个270M参数的语言模型。

0 人收藏 0 人点赞
#gemma

如何复制自己的写作风格

Reddit r/LocalLLaMA · 2026-06-15

用户询问,在本地LLM中提供其写作风格的样本,是放在对话中更有效,还是放在系统提示中更有效。

0 人收藏 0 人点赞
#gemma

@iluciddreaming: 玩了两个月本地 LLM。 用 Windows 11 + llama.cpp + llama-swap 狂测各种开源模型,这是我的最终成绩单: 硬件:i7-13700 + 64GB RAM + RTX 4070 目前最能打的组合是 gemm…

X AI KOLs Timeline · 2026-06-15 缓存

经过两个月本地 LLM 测试,作者认为 gemma-4-12B-it-QAT 和 MTP 辅助组合在速度和可用性上表现最佳,硬件为 i7-13700 + 64GB RAM + RTX 4070。

0 人收藏 0 人点赞
#gemma

React Native ExecuTorch 现已支持 Gemma 4(Vulkan 和 MLX 加速)

Reddit r/LocalLLaMA · 2026-06-15

react-native-executorch 库现已集成 Google 的 Gemma 4 模型,可实现完全离线的 GPU 加速推理,在 Android 上使用 Vulkan 委托,在 Apple Silicon 上使用 MLX 委托。

0 人收藏 0 人点赞
#gemma

打造出一款能创建高度个性化 macOS 应用的 macOS 应用,支持 Gemma 4 E2B 等小模型

Reddit r/LocalLLaMA · 2026-06-15

Ironsmith 是一款开源 macOS 应用,只需一个提示即可生成本地 macOS 应用,使用 Gemma 4 等本地 AI 模型,能在 8GB MacBook Air 等低端硬件上运行。

0 人收藏 0 人点赞
#gemma

Gemma 12b 低于10瓦 6.5pp 1.3tg

Reddit r/LocalLLaMA · 2026-06-14

在Google Pixel 10 Pro上使用llama.cpp运行Gemma 12B模型,实现了每秒6.5个token的提示处理和每秒1.3个token的生成,功耗低于10瓦,展示了高效的设备端AI推理。

0 人收藏 0 人点赞
#gemma

Qwen 3.6 35B-A3B @ Q4 还是 Gemma 4 12B @ Q8?

Reddit r/LocalLLaMA · 2026-06-14

用户就如何在 Q4 量化的 Qwen 3.6 35B-A3B 和 Q8 量化的 Gemma 4 12B 之间做出选择征求意见,用于本地代码库工作,设备为 32GB 统一内存。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈