@omarsar0: 太棒了！我最近花了很多时间在研究扩散LLM上，所以这真是完美的时机。我觉得有……

X AI KOLs Following 2026/06/10 16:10 模型

diffusion-models open-source google-deepmind text-diffusion gemma llm

摘要

Google DeepMind 发布了 DiffusionGemma，这是一个开放实验模型，以块的形式生成文本而非逐词生成，实现了自我修正和更快的输出。

太棒了！我最近花了很多时间在研究扩散LLM上，所以这真是完美的时机。我觉得关于文本扩散还有很多未充分探索的研究问题。权重可在 HF 上获取。 https://t.co/BpZM7Vxwvm

查看原文

查看缓存全文

缓存时间: 2026/06/10 17:53

太棒了！

我最近花了很多时间研究扩散语言模型，所以这个时机太完美了。

我觉得文本扩散领域还有很多未被充分探索的研究问题。

权重已在 Hugging Face 上提供。https://t.co/BpZM7Vxwvm

谷歌 DeepMind（@GoogleDeepMind）： DiffusionGemma 是我们新的实验性开放模型，在专用 GPU 上输出速度提升高达 4 倍。

它并非逐词预测，而是同时生成整个文本块。这让模型能够实时自我修正并格式化复杂的 Markdown 内容。

相似文章

X AI KOLs Timeline

谷歌已开源DiffusionGemma，这是一种基于扩散的新型文本生成模型，采用块扩散和高效的编解码器技术，康奈尔大学的研究人员也做出了贡献。

Hugging Face Models Trending

Google DeepMind 发布了 DiffusionGemma，这是一个 26B 参数的 Mixture-of-Experts 模型，使用离散扩散实现更快的文本生成，支持多模态输入和 256K token 上下文。

Hacker News Top

Google推出DiffusionGemma，这是一个实验性的26B MoE开源模型，通过文本扩散技术，在GPU上实现高达4倍的文本生成速度提升，针对速度要求高的交互式本地工作流。

X AI KOLs Timeline

vLLM宣布原生支持Google DeepMind的DiffusionGemma，这是一个260亿参数的离散扩散语言模型，能够并行生成256个token的块，在单个H200上实现1200+ tok/s的低延迟推理。

Ars Technica

谷歌发布了DiffusionGemma，这是一个实验性的开源文本生成扩散模型，相比自回归模型实现了4倍速度提升，并针对本地处理进行了优化。