@charles_irl: 当你们在封装OpenAI时，我研究了𝕋𝕙𝕖 ℂ𝕌𝔻𝔸 当你们在进行风投对话时，我掌握了𝔗𝔥𝔢 ℑ𝔫𝔣𝔢𝔯𝔢𝔫…

X AI KOLs Following 2026/02/12 01:02 工具

open-source ai-stack inference deepseek modal sglang

摘要

Modal Jazz 是一个完整的开源AI堆栈，使用Modal、DeepSeek V4 Pro和SGLang进行自托管语言模型推理，前端包括OpenCode、OpenClaw和Vercel AI SDK。

当你们在封装OpenAI时，我研究了𝕋𝕙𝕖 ℂ𝕌𝔻𝔸 当你们在进行风投对话时，我掌握了𝔗𝔥𝔢 ℑ𝔫𝔣𝔢𝔯𝔢𝔫𝔠𝔢 𝔖𝔢𝔯𝔳𝔢𝔯 现在开源AI来了，你们竟敢来找我帮忙？好！我写了一些文档。 https://t.co/95XSG31K0P

查看原文

查看缓存全文

缓存时间: 2026/06/18 18:09

当你还在包装OpenAI的时候，我已经在研究CUDA了。

当你还在跟VC闲聊的时候，我已经把推理服务器玩明白了。

现在开源AI来了，你倒有脸来找我帮忙？

行！我写了份文档。

https://t.co/95XSG31K0P

modal-projects/modal-jazz

来源：https://github.com/modal-projects/modal-jazz

🎷 Modal Jazz

爵士精神就是开放精神。

——赫比·汉考克，论软件许可

我先弹出来，再告诉你它是什么。

——迈尔斯·戴维斯，论氛围编码

这个仓库汇集了一套完整的“开源AI栈”——运行智能语言模型及其辅助完成有用任务的接口所需的一切。它基于 Modal (https://modal.com) 构建。

开源语言模型后端

语言模型采用 DeepSeek V4 Pro (https://api-docs.deepseek.com/news/news260424)。

运行环境包括：

Nvidia B200 GPU
Modal (https://modal.com/) 云部署平台（项目赞助方）
SGLang 推理服务器 (https://github.com/sgl-project/sglang)
OpenAI 兼容的 API 接口（基于 /chat/completions）。

为加速模型权重下载，你需要添加一个 Hugging Face (https://huggingface.co/) 访问令牌，并作为 Modal Secret (https://modal.com/secrets) 存储。

对于单个用户，该设置可实现 >150 tok/s 的输出速度。

开源前端 - `/frontends`

智能编码 TUI + WebUI - OpenCode

OpenCode (https://opencode.ai) 是一个终端用户界面，用于连接人类用户、语言模型和计算机终端，类似于 Anthropic 的 Claude Code (https://code.claude.com/docs/en/overview)，但支持更广泛的 LLM API。

我们提供了将自托管 LLM 与 OpenCode 集成，以及在 Modal 上部署 OpenCode 服务器的说明，详见这里。

智能助手 - OpenClaw

OpenClaw (https://docs.openclaw.ai) 是一个注重最大可集成性的智能助手系统。

我们提供了将自托管 LLM 与 OpenClaw 集成的说明，详见这里。

聊天 Web UI - AI SDK

Vercel AI SDK (https://ai-sdk.dev/) 提供核心和 UI 两个子 SDK，用于将 JavaScript 应用与 LLM 集成。

我们展示了如何简单地将此栈与自托管 LLM 集成——包括一个“Hello World”级别的 NodeJS CLI 集成（详见这里）和一个完整的 NextJS 应用（详见这里）。

该应用已部署在此处 (https://jazz.modal.chat)。

聊天 CLI - `llm`

我们喜欢 Simon Willison 的 llm CLI 工具 (https://github.com/simonw/llm)，用于在终端中快速执行 LLM 查询。

它通过与 OpenAI 模型相同的接口，支持与 OpenAI 兼容的 API 提供商（如我们的自托管 LLM）集成。文档见此处 (https://llm.datasette.io/en/stable/other-models.html)。

我们在 llm_show_reasoning 中演示了一个小插件，用于打印 LLM 的推理输出——OpenAI 推理模型不提供此功能，但开源模型可以。这能有效降低表观延迟。

@charles_irl: 当你们在封装OpenAI时，我研究了𝕋𝕙𝕖 ℂ𝕌𝔻𝔸 当你们在进行风投对话时，我掌握了𝔗𝔥𝔢 ℑ𝔫𝔣𝔢𝔯𝔢𝔫…

modal-projects/modal-jazz

🎷 Modal Jazz

开源语言模型后端

开源前端 - `/frontends`

智能编码 TUI + WebUI - OpenCode

智能助手 - OpenClaw

聊天 Web UI - AI SDK

聊天 CLI - `llm`

相似文章

@charles_irl: 几年前，人工智能的未来看起来一片黯淡——专有模型、专有推理服务……

@nanjiangwill: 在 @modal，我们正在努力确保开源强化学习框架具备训练前沿开放权重模型所需的所有技术…

@charles_irl: 掌控你的推理，掌控你的代理平台，掌控你的命运。在 @modal Endpoints 上使用 OpenInspect。

@charles_irl: 恰当的后训练强化学习，广泛部署，是迈向未来软件系统能悄然自我改进、适应人类需求的关键一步。

@SigGravitas: https://x.com/SigGravitas/status/2061554698285404289

提交意见反馈

modal-projects/modal-jazz

🎷 Modal Jazz

开源语言模型后端

开源前端 - /frontends

智能编码 TUI + WebUI - OpenCode

智能助手 - OpenClaw

聊天 Web UI - AI SDK

聊天 CLI - llm

相似文章

@charles_irl: 几年前，人工智能的未来看起来一片黯淡——专有模型、专有推理服务……

@nanjiangwill: 在 @modal，我们正在努力确保开源强化学习框架具备训练前沿开放权重模型所需的所有技术…

@charles_irl: 掌控你的推理，掌控你的代理平台，掌控你的命运。在 @modal Endpoints 上使用 OpenInspect。

@charles_irl: 恰当的后训练强化学习，广泛部署，是迈向未来软件系统能悄然自我改进、适应人类需求的关键一步。

@SigGravitas: https://x.com/SigGravitas/status/2061554698285404289

提交意见反馈

开源前端 - `/frontends`

聊天 CLI - `llm`