预算有限，为我的RX 6800提供购买建议

Reddit r/LocalLLaMA 2026/06/11 11:55 工具

gpu vram inference budget llm radeon-vii p100

摘要

本帖子讨论在RX 6800基础上，为LLM推理选择预算GPU（Radeon VII vs 两块P100），重点分析MoE模型的VRAM与速度权衡。

经过几个小时的调研，我陷入了两难：是买一块Radeon VII还是两块P100（两套方案大概都是240欧元）。Radeon VII能提供32GB显存和较快的推理速度，而两块P100总共48GB，但据我估算推理速度会慢大约30%。请问多出来的显存是否真的有用，还是根本用不上？我的数据有没有算错或遗漏？我在想，对于Q8精度的MoE模型，额外显存是否更有价值？除了Qwen和Gemma，还有没有其他值得关注的更大MoE模型，能让我在多显存中获益？各位有什么推荐吗？欢迎任何建议。

查看原文

预算有限，为我的RX 6800提供购买建议

相似文章

我比较了这里使用的主要GPU/机器的所有规格，因为带宽不是一切。你们有些人需要认清现实。

2026年第二季度，在3x3090（72GB显存）配置上最好的模型？

在6GB RTX 4050上对20个小LLM的基准测试

Rotary GPU：在有限显存下探索大型MoE模型的本地执行

ROCm vs Vulkan vs vLLM 在双R9700上的对比

提交意见反馈