@DeRonin_: 我目前的本机AI配置:- 2x DGX Spark 链接 (256gb) > GLM 5.2 @ 2bit, 推理 + 代理循环 - Mac Studio M3 Ultr…

X AI KOLs Following 新闻

摘要

一位用户描述了他们完全本地的AI堆栈,使用多个硬件设备运行GLM、Qwen和Kimi等中国模型,声称相比GPT-5.5和Opus 4.8等前沿模型节省了87%的成本,同时提到了自托管视频生成的计划。

我目前的本机AI配置: - 2x DGX Spark 链接 (256gb) > GLM 5.2 @ 2bit, 推理 + 代理循环 - Mac Studio M3 Ultra 96gb > Wan 2.2, 图像生成 - Mac mini M5 Pro 64gb > Qwen3.6-35B, 代码 + 内容草稿 - MB Air M5 24gb > Qwen3 30B-A3B, 批量处理 - iPhone > Qwen3 4B, 设备端 以上所有模型均运行在我自己拥有的硬件上,权重下载,循环中没有API密钥 我尚未自托管的一件事是视频……开放视频模型需要专用的GPU盒子,所以这是我要做的下一个构建(等我弄清楚如何用这个赚到10万美元月经常性收入哈哈) 我正在扩展的另一个是Kimi K2.7完全本地化……这是一个1T模型,所以需要真正的GPU服务器,随着收入增长而添加 对于MiMo V2.5,与Kimi和Kling相同 前沿AI过去需要别人的数据中心……现在它适合放在我的桌子上
查看原文
查看缓存全文

缓存时间: 2026/06/30 13:46

我当前的本地 AI 配置:

  • 2 台 DGX Spark 互联(256GB)> GLM 5.2 @ 2bit,推理 + 智能体循环
  • Mac Studio M3 Ultra 96GB > Wan 2.2,图像生成
  • Mac mini M5 Pro 64GB > Qwen3.6-35B,代码 + 内容草稿
  • MB Air M5 24GB > Qwen3 30B-A3B,批量处理
  • iPhone > Qwen3 4B,设备端运行

以上所有模型均在我自有的硬件上运行,权重已下载,无 API 密钥介入。

目前唯一未自托管的是视频……开源视频模型需要专用 GPU 机箱,所以这是我的下一个构建目标(等我搞明白如何靠它实现 10 万美元月收入再说 lol)。

另一个我正在扩展的目标是完全本地化的 Kimi K2.7……它是一个 1T 模型,需要真正的 GPU 服务器,随着营收增长逐步添加。

对于 MiMo V2.5,情况与 Kimi 和 Kling 类似。

前沿 AI 曾经需要别人的数据中心……如今它已能放在我的桌面上。

目前我猜这套配置估值大约 2 万美元。

相似文章