@andrewchen：体验本地AI模型的主要缺点在于你会买一块GPU，然后另一块，接着又一块……

X AI KOLs Following 2026/05/19 00:54 新闻

local-ai-models gpu qwen hardware experimentation

摘要

Andrew Chen分享了他为本地AI实验购买多块GPU的经历，在5090 eGPU上以100 tok/s运行Qwen3.6 27B密集模型，并将其与Sonnet 4.6进行比较。

发现使用本地AI模型的主要缺点在于你会买一块GPU，然后另一块，接着又一块，再接着一块…… 但我现在在5090 eGPU上以100 tok/s的速度运行qwen3.6 27b密集模型！感觉就像sonnet 4.6？快速且高度可用我想我手头的这些GPU在未来几年内会增值，所以这一切都是值得的。

查看原文

查看缓存全文

缓存时间: 2026/05/19 02:42

发现本地AI模型实验的主要弊端就是——你会买一块GPU，接着又一块，接着又一块……

不过我现在用5090 eGPU跑qwen3.6 27b密集模型，速度已经达到100 tok/s了！用起来感觉就像sonnet 4.6？又快又好用

我估摸着，我手里的这些GPU未来几年会越来越值钱，所以一切都值得。

相似文章

X AI KOLs Timeline

一位用户分享了他们搭建双GPU本地AI实验室的经验，使用了RTX 4080 Super和5060 Ti，通过llama.cpp和llama-swap运行Qwen 3.6模型，以降低API成本并实现无限制的实验。

X AI KOLs Timeline

提醒一下，两块RTX 3090加上Qwen 3.6 27B或Gemma 4 31B等开源模型，就可以运行强大的本地AI代理，性能堪比Opus 4.5，配合Claude Code、自托管SearXNG等工具使用。

X AI KOLs Following

一位研究人员表示，是时候购买更多GPU并构建本地AI堆栈了，并提到Qwen 3.5 27B和GLM 5.2等模型消除了永久底层阶级的威胁。

X AI KOLs Following

一位用户描述了他们完全本地的AI堆栈，使用多个硬件设备运行GLM、Qwen和Kimi等中国模型，声称相比GPT-5.5和Opus 4.8等前沿模型节省了87%的成本，同时提到了自托管视频生成的计划。

X AI KOLs Following

作者强调了在 RTX 5090 上本地运行开源 Qwen 3.6-27B 模型的卓越能力，指出其在编程任务上的强劲表现，并与商业模型进行了对比，尽管本地部署过程颇具挑战性。