rtx-4090

#rtx-4090

DeepSeek v4 Flash 在 4090 + DDR5 上的体验

Reddit r/LocalLLaMA ↗ · 2026-07-10

一位用户分享了在 24GB 显卡和 DDR5 内存上运行 DeepSeek v4 Flash 模型的体验，包括性能数据和优化技巧。

0 人收藏 0 人点赞

#rtx-4090

X AI KOLs Timeline ↗ · 2026-06-18 缓存

我们率先通过将稀疏注意力内核移植到 Ada GPU，在 RTX 4090 上运行完整的 GLM-5.2（753B FP8），从而让前沿开放权重模型可在消费级硬件上运行。

0 人收藏 0 人点赞

#rtx-4090

Reddit r/LocalLLaMA ↗ · 2026-05-16

一位用户寻求社区反馈，关于在GpuWorld.eu购买改装版RTX 4090 48GB显存的显卡，询问可靠的来源以及像淘宝这样的替代卖家。

0 人收藏 0 人点赞

#rtx-4090

Reddit r/LocalLLaMA ↗ · 2026-05-15

一位Reddit用户对中国改装GPU（如48GB版RTX 4090）表示好奇，寻求关于性能、可靠性和购买渠道的信息，并提议组建一个研究小组。

0 人收藏 0 人点赞

#rtx-4090

Reddit r/LocalLLaMA ↗ · 2026-05-08

开发者通过将 MTP（多 Token 预测）与 TurboQuant 的无损 KV缓存压缩技术相结合，在单张 RTX 4090 上实现了 Qwen3.6-27B 模型在 262K 上下文下 80+ token/秒的推理速度，并分享了实现分支和技术细节。

1 人收藏 1 人点赞