diffusiongemma

#diffusiongemma

评估 DiffusionGemma 透明度（9分钟阅读）

TLDR AI ↗ · 2026-06-22 缓存

分析了 Google 的 DiffusionGemma 模型发布的透明度，讨论了其对 AI 安全与问责的影响。

0 人收藏 0 人点赞

#diffusiongemma

Reddit r/LocalLLaMA ↗ · 2026-06-18

一位用户分享了他们在4090 GPU上通过vLLM运行DiffusionGemma 26B的经验，速度高达475t/s，但指出了单用户限制、准确度较低和上下文短等缺点，并认为它不值得替代常规的26B模型。

0 人收藏 0 人点赞

#diffusiongemma

Reddit r/LocalLLaMA ↗ · 2026-06-14

讨论优化DiffusionGemma推理、减少幻觉以及提高工具使用和代理性能的多种方法，包括熵约束采样、模式脚手架和去噪期间的检索。

0 人收藏 0 人点赞

#diffusiongemma

Reddit r/LocalLLaMA ↗ · 2026-06-11

报告了在四块AMD 7900 XTX GPU上使用vllm运行DiffusionGemma 26B，生成时达到100 tps，总时间约为45-60 t/s（包括提示处理等待时间），并分享了性能指标和设置命令。

0 人收藏 0 人点赞

#diffusiongemma

Reddit r/LocalLLaMA ↗ · 2026-06-11

本文介绍了在RTX 5090 GPU上运行DiffusionGemma 26B A4B GGUF模型的基准测试结果及调优参数，通过优化温度设置和量化选择实现最高44%的加速。

0 人收藏 0 人点赞

#diffusiongemma

X AI KOLs Following ↗ · 2026-06-10 缓存

NVIDIA 在 Hugging Face 上发布了一个名为 DiffusionGemma 的 26B MoE 多模态模型，采用 NVFP4 量化，在 Hopper 硬件上达到每秒超过 1100 个 token 的速度。

0 人收藏 0 人点赞

#diffusiongemma

NVIDIA Blog ↗ · 2026-06-10 缓存

NVIDIA 优化了 Google DeepMind 的 DiffusionGemma——一个能并行生成 256 个令牌文本块的开放模型，在本地 RTX GPU、DGX Spark 和 DGX Station 系统上实现了高达 4 倍的性能提升。

0 人收藏 0 人点赞

#diffusiongemma

Reddit r/LocalLLaMA ↗ · 2026-06-10 缓存

DiffusionGemma 是 Google DeepMind 推出的全新实验模型，可在 256 令牌画布上实现并行生成，在 GPU 上令牌生成速度提升高达 4 倍。本开发者指南阐述了其架构、双向上下文，并提供了用于解决数独的微调配方。

0 人收藏 0 人点赞

#diffusiongemma

Hugging Face Models Trending ↗ · 2026-06-10 缓存

Unsloth 发布了 Google DeepMind 的 DiffusionGemma (26B-A4B) 的 GGUF 量化版本，这是一种新的块扩散架构，可实现更快的文本生成，已准备好用于 llama.cpp。

0 人收藏 0 人点赞