真不敢相信我成功了!双GPU - 48GB显存 llama-cpp服务器 - R7900 + 7800XT

Reddit r/LocalLLaMA 新闻

摘要

一位用户成功在Kubuntu 24.04上通过Docker中的Vulkan设置了一个双GPU llama-cpp服务器,使用AMD Radeon PRO和7800 XT,拥有48GB显存。

配置:Kubuntu 24.04 - AMD显卡 - R9700 AI PRO 和 7800XT(32GB + 16GB)- llama-cpp服务器 - 在Docker中堆叠设置 - Vulkan镜像。我试过ROCM,但它与RDNA4 + RDNA3混合不兼容。Vulkan似乎可行。我快速测试了一个提示,希望它稳定,因为如果稳定,我就有48GB显存可以玩了。不得不买一个新电源,但花了300美元就能利用我旧的7800XT,我觉得非常值得。
查看原文

相似文章

双GPU llama.cpp加速

Reddit r/LocalLLaMA

llama.cpp的一个分支修复了量化KV缓存中的--split-mode tensor问题,在双GPU配置上实现高达40%的速度提升,且无质量损失。

我们真的都能搞定,对吧?双3090配置。

Reddit r/LocalLLaMA

一位用户分享了他们搭建双3090 GPU系统以本地运行Qwen 3.6 27b模型的经验,在切换到Ubuntu并使用带有自定义补丁的club-3090工具后,实现了超过100 tokens/秒的速度。他们对本地AI的未来感到兴奋。