@DeRonin_: 我目前的本机AI配置：- 2x DGX Spark 链接 (256gb) > GLM 5.2 @ 2bit, 推理 + 代理循环 - Mac Studio M3 Ultr…

X AI KOLs Following 2026/06/30 12:51 新闻

local-ai self-hosting chinese-models qwen kimi dgx-spark hardware-setup

摘要

一位用户描述了他们完全本地的AI堆栈，使用多个硬件设备运行GLM、Qwen和Kimi等中国模型，声称相比GPT-5.5和Opus 4.8等前沿模型节省了87%的成本，同时提到了自托管视频生成的计划。

我目前的本机AI配置： - 2x DGX Spark 链接 (256gb) > GLM 5.2 @ 2bit, 推理 + 代理循环 - Mac Studio M3 Ultra 96gb > Wan 2.2, 图像生成 - Mac mini M5 Pro 64gb > Qwen3.6-35B, 代码 + 内容草稿 - MB Air M5 24gb > Qwen3 30B-A3B, 批量处理 - iPhone > Qwen3 4B, 设备端以上所有模型均运行在我自己拥有的硬件上，权重下载，循环中没有API密钥我尚未自托管的一件事是视频……开放视频模型需要专用的GPU盒子，所以这是我要做的下一个构建（等我弄清楚如何用这个赚到10万美元月经常性收入哈哈）我正在扩展的另一个是Kimi K2.7完全本地化……这是一个1T模型，所以需要真正的GPU服务器，随着收入增长而添加对于MiMo V2.5，与Kimi和Kling相同前沿AI过去需要别人的数据中心……现在它适合放在我的桌子上

查看原文

查看缓存全文

缓存时间: 2026/06/30 13:46

我当前的本地 AI 配置：

2 台 DGX Spark 互联（256GB）> GLM 5.2 @ 2bit，推理 + 智能体循环
Mac Studio M3 Ultra 96GB > Wan 2.2，图像生成
Mac mini M5 Pro 64GB > Qwen3.6-35B，代码 + 内容草稿
MB Air M5 24GB > Qwen3 30B-A3B，批量处理
iPhone > Qwen3 4B，设备端运行

以上所有模型均在我自有的硬件上运行，权重已下载，无 API 密钥介入。

目前唯一未自托管的是视频……开源视频模型需要专用 GPU 机箱，所以这是我的下一个构建目标（等我搞明白如何靠它实现 10 万美元月收入再说 lol）。

另一个我正在扩展的目标是完全本地化的 Kimi K2.7……它是一个 1T 模型，需要真正的 GPU 服务器，随着营收增长逐步添加。

对于 MiMo V2.5，情况与 Kimi 和 Kling 类似。

前沿 AI 曾经需要别人的数据中心……如今它已能放在我的桌面上。

目前我猜这套配置估值大约 2 万美元。

@DeRonin_: 我目前的本机AI配置：- 2x DGX Spark 链接 (256gb) > GLM 5.2 @ 2bit, 推理 + 代理循环 - Mac Studio M3 Ultr…

相似文章

@TheAhmadOsman: 温馨提醒，开始使用本地AI所需的一切就是： - 2x RTX 3090（在r/hardwareswap上花$700-$900入手） -…

@DeRonin_: 我的整个AI栈现在都换成中国产品了，便宜87%。相同收入，按任务替换：1. 推理/后端大脑 Opus 4.8 → Kimi…

@RayFernando1337: https://x.com/RayFernando1337/status/2070621713952579990

@andrewchen：体验本地AI模型的主要缺点在于你会买一块GPU，然后另一块，接着又一块……

@rohanpaul_ai: atomic[.]chat（一款本地运行大语言模型的桌面应用）在 MacBook 上进行了一场极具揭示性的本地 AI 智能体对比测试……

提交意见反馈