system-ram

#system-ram

将大型模型卸载到系统内存时的性能表现？

Reddit r/LocalLLaMA ↗ · 2026-05-24

讨论了将大型AI模型权重从GPU显存卸载到系统内存时的性能权衡，比较了不同GPU配置（如RTX 5090与RTX6000）在运行DeepSeek V4 Pro等模型时的表现。

0 人收藏 0 人点赞

#system-ram

Reddit r/LocalLLaMA ↗ · 2026-05-22

一位用户分享了他们使用 llama.cpp 服务器进行模型卸载的经验，指出了性能权衡和安静运行的优势，并询问了解该工具如何在 VRAM 和系统 RAM 之间管理内存的阅读资源。

0 人收藏 0 人点赞