dual-gpu

#dual-gpu

双GPU下流水线与张量并行的llama.cpp中测量PCIe传输

Reddit r/LocalLLaMA ↗ · 2026-07-11

在双GPU下使用流水线和张量并行运行llama.cpp时的PCIe传输性能分析。

0 人收藏 0 人点赞

#dual-gpu

Reddit r/LocalLLaMA ↗ · 2026-06-27

讨论使用两张Radeon RX 9060 XT 16GB显卡组成CrossFire配置的潜在价值，可能权衡性能与成本。

0 人收藏 0 人点赞

#dual-gpu

Reddit r/LocalLLaMA ↗ · 2026-06-21

对运行在双AMD Radeon 9700 GPU上的AI推理框架ROCm、Vulkan和vLLM进行比较，可能是在对大型语言模型的性能进行基准测试。

0 人收藏 0 人点赞

#dual-gpu

Reddit r/LocalLLaMA ↗ · 2026-06-12

一位用户使用llama.cpp（行/张量切分）和ik_llama（图切分）在两张RTX 3080 20GB上对双GPU推理速度进行了基准测试，使用Qwen3.6-27B GGUF模型，比较了token生成和提示处理速度。

0 人收藏 0 人点赞

#dual-gpu

Reddit r/LocalLLaMA ↗ · 2026-05-22

一位用户成功在Kubuntu 24.04上通过Docker中的Vulkan设置了一个双GPU llama-cpp服务器，使用AMD Radeon PRO和7800 XT，拥有48GB显存。

0 人收藏 0 人点赞

#dual-gpu

Reddit r/LocalLLaMA ↗ · 2026-05-17

llama.cpp的一个分支修复了量化KV缓存中的--split-mode tensor问题，在双GPU配置上实现高达40%的速度提升，且无质量损失。

0 人收藏 0 人点赞