diffusion-gemma

#diffusion-gemma

为何 DiffusionGemma 在工具调用上可能优于其基准质量所暗示的表现

Reddit r/LocalLLaMA ↗ · 2026-06-16

分析了 DiffusionGemma 的双向注意力和并行块生成如何由于其能够修正 token 的能力，可能产生更高的有效工具调用率，尽管其基础质量低于 Gemma 4。

0 人收藏 0 人点赞

#diffusion-gemma

Reddit r/LocalLLaMA ↗ · 2026-06-16

分享了一个用于 Diffusion Gemma 的越狱提示词，它通过操纵系统提示词来覆盖安全策略，从而允许生成不受限制的内容。

0 人收藏 0 人点赞

#diffusion-gemma

Reddit r/LocalLLaMA ↗ · 2026-06-12

一项基准测试显示，Diffusion Gemma 比 Gemma4 速度快4倍，但事实性错误多6倍，尤其是在冷门话题上，为了生成流畅文本而牺牲了事实准确性。

0 人收藏 0 人点赞

#diffusion-gemma

Reddit r/LocalLLaMA ↗ · 2026-06-11

DiffusionGemma 的内部测试显示，在实际工作负载下，H100 与 A100 GPU 之间存在显著的性能差异；H100 在并发下的扩展性更好，且效率因工作负载类型而异，这引发了对基准测试可靠性的质疑。

0 人收藏 0 人点赞

#diffusion-gemma

X AI KOLs Timeline ↗ · 2026-06-10 缓存

vLLM宣布原生支持Google DeepMind的DiffusionGemma，这是一个260亿参数的离散扩散语言模型，能够并行生成256个token的块，在单个H200上实现1200+ tok/s的低延迟推理。

0 人收藏 0 人点赞

#diffusion-gemma

X AI KOLs Following ↗ · 2026-06-10 缓存

DiffusionGemma 已发布；它受计算限制，比其它 Gemma-4 模型快 4 倍（H100 上 1k tok/s），擅长编码任务，包括 3D 生成和前端开发。

0 人收藏 0 人点赞

#diffusion-gemma

Hacker News Top ↗ · 2026-06-10 缓存

Google推出DiffusionGemma，这是一个实验性的26B MoE开源模型，通过文本扩散技术，在GPU上实现高达4倍的文本生成速度提升，针对速度要求高的交互式本地工作流。

0 人收藏 0 人点赞