rtx4090

#rtx4090

@davideciffa: 如果你拥有Nvidia RTX 4090，--ddtree-budget 36是最佳配置，可在解码过程中带来2.5倍速度提升…

X AI KOLs Timeline ↗ · 2026-05-24 缓存

一条推文推荐Nvidia RTX 4090使用--ddtree-budget 36，声称在Qwen3.6_27B解码时实现2.5倍加速。

0 人收藏 0 人点赞

#rtx4090

Reddit r/LocalLLaMA ↗ · 2026-05-12

作者展示了如何在通过 llama.cpp 运行量化 Qwen 模型时，在不牺牲推理速度的前提下，将 RTX 4090 的功耗降低高达 40%。通过 nvidia-smi 限制 GPU 功耗上限并调整 llama-server 参数，用户可显著降低发热与噪音，并延长硬件使用寿命。

0 人收藏 0 人点赞