4090

#4090

在4090上以高达475t/s运行DiffusionGemma 26b……以及一些想法

Reddit r/LocalLLaMA ↗ · 6天前

一位用户分享了他们在4090 GPU上通过vLLM运行DiffusionGemma 26B的经验，速度高达475t/s，但指出了单用户限制、准确度较低和上下文短等缺点，并认为它不值得替代常规的26B模型。

0 人收藏 0 人点赞