parallel-inference

标签

Cards List
#parallel-inference

@_philschmid: Gemma 迎来扩散模型!DiffusionGemma 每秒可处理高达1000+个token! - 基于Gemma 4构建,为26B MoE模型。 - 3.8B…

X AI KOLs Following · 13小时前 缓存

DiffusionGemma 是一个基于 Gemma 4 的 26B MoE 模型,通过扩散模型以256个token的块进行文本生成,每秒可处理超过1000个token,经量化后可在18GB显存内运行,已根据 Apache 2.0 许可发布。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈