rtx4090

标签

Cards List
#rtx4090

@davideciffa: 如果你拥有Nvidia RTX 4090,--ddtree-budget 36是最佳配置,可在解码过程中带来2.5倍速度提升…

X AI KOLs Timeline · 2026-05-24 缓存

一条推文推荐Nvidia RTX 4090使用--ddtree-budget 36,声称在Qwen3.6_27B解码时实现2.5倍加速。

0 人收藏 0 人点赞
#rtx4090

停止浪费电力

Reddit r/LocalLLaMA · 2026-05-12

作者展示了如何在通过 llama.cpp 运行量化 Qwen 模型时,在不牺牲推理速度的前提下,将 RTX 4090 的功耗降低高达 40%。通过 nvidia-smi 限制 GPU 功耗上限并调整 llama-server 参数,用户可显著降低发热与噪音,并延长硬件使用寿命。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈