@mervenoyann: DiffusionGemma 已发布,它受计算限制,因此相比其他 Gemma-4 模型快 4 倍(H100 上 1k tok/s),在……方面也很出色

X AI KOLs Following 模型

摘要

DiffusionGemma 已发布;它受计算限制,比其它 Gemma-4 模型快 4 倍(H100 上 1k tok/s),擅长编码任务,包括 3D 生成和前端开发。

DiffusionGemma 已发布 🔥 它受计算限制,因此相比其他 Gemma-4 模型快 4 倍(H100 上 1k tok/s)💨 在编码方面也很出色,可生成并迭代从 3D 生成到前端的任何代码 ⤵️ https://t.co/NAjEaml6dV
查看原文
查看缓存全文

缓存时间: 2026/06/10 17:53

DiffusionGemma 发布了 🔥

它是计算密集型模型,因此比其他 Gemma-4 模型快 4 倍(H100 上每秒 1000 token)💨

在编码方面也很出色,可以生成并迭代从 3D 生成到前端的任何代码 ⤵️ https://t.co/NAjEaml6dV

相似文章

DiffusionGemma: 文本生成速度提升4倍

Hacker News Top

Google推出DiffusionGemma,这是一个实验性的26B MoE开源模型,通过文本扩散技术,在GPU上实现高达4倍的文本生成速度提升,针对速度要求高的交互式本地工作流。

Gemma 4 26B 在单块 RTX 5090 上达到 600 Tok/s

Reddit r/LocalLLaMA

一项基准测试显示,使用 vLLM 搭配 DFlash 投机解码,在单块 RTX 5090 上将 Gemma 4 26B 的推理速度提升至约 578 tokens/s,相比基线实现了 2.56 倍的加速。