旧款Titan显卡还值得用吗?

Reddit r/LocalLLaMA 新闻

摘要

一位用户探讨了旧款Nvidia Titan显卡在运行Gemma/Qwen MOE编程模型方面的可行性,并与新款消费级显卡在内存带宽和成本上进行了比较。

关注价格低于200英镑的旧款Nvidia显卡,用于Gemma/Qwen MOE编程。除了功耗高之外,旧款Titan 12GB显卡还有其他理由避免使用吗?它们的内存带宽比新款消费级显卡更高:Titan X 12GB 480GB/s、Titan XP 12GB 547GB/s、Titan V 12GB 652GB/s、RTX 2060 12GB 336GB/s、RTX 2080 Ti 11GB 616GB/s、RTX 3060 12GB 360GB/s
查看原文

相似文章

Qwen3.6-35B 与 Gemma4-26B 在 7900 XTX 上的对比

Reddit r/LocalLLaMA

一项详细的基准测试对比了 Radeon 7900 XTX 上的 Qwen3.6-35B 和 Gemma4-26B,结果显示尽管 Gemma 的 token 生成速度较慢,但端到端快了约 20%,原因是 Qwen 因内部推理生成了约两倍的 token。文章建议:在吞吐量受限的批量任务中使用 Qwen,在延迟敏感的单次请求中使用 Gemma。

一台10年前的Xeon就够了

Hacker News Top

一篇博客文章,详细介绍了如何仅使用CPU和DDR3内存,在10年前的Xeon服务器上运行Gemma 4 AI模型,并使用了自定义的llama.cpp优化。