@charles_irl: 当你们在封装OpenAI时,我研究了𝕋𝕙𝕖 ℂ𝕌𝔻𝔸 当你们在进行风投对话时,我掌握了𝔗𝔥𝔢 ℑ𝔫𝔣𝔢𝔯𝔢𝔫…
摘要
Modal Jazz 是一个完整的开源AI堆栈,使用Modal、DeepSeek V4 Pro和SGLang进行自托管语言模型推理,前端包括OpenCode、OpenClaw和Vercel AI SDK。
查看缓存全文
缓存时间: 2026/06/18 18:09
当你还在包装OpenAI的时候, 我已经在研究CUDA了。
当你还在跟VC闲聊的时候, 我已经把推理服务器玩明白了。
现在开源AI来了,你倒有脸来找我帮忙?
行!我写了份文档。
https://t.co/95XSG31K0P
modal-projects/modal-jazz
来源:https://github.com/modal-projects/modal-jazz
🎷 Modal Jazz
爵士精神就是开放精神。
——赫比·汉考克,论软件许可
我先弹出来,再告诉你它是什么。
——迈尔斯·戴维斯,论氛围编码
这个仓库汇集了一套完整的“开源AI栈”——运行智能语言模型及其辅助完成有用任务的接口所需的一切。它基于 Modal (https://modal.com) 构建。
开源语言模型后端
语言模型采用 DeepSeek V4 Pro (https://api-docs.deepseek.com/news/news260424)。
运行环境包括:
- Nvidia B200 GPU
- Modal (https://modal.com/) 云部署平台(项目赞助方)
- SGLang 推理服务器 (https://github.com/sgl-project/sglang)
- OpenAI 兼容的 API 接口(基于
/chat/completions)。
为加速模型权重下载,你需要添加一个 Hugging Face (https://huggingface.co/) 访问令牌,并作为 Modal Secret (https://modal.com/secrets) 存储。
对于单个用户,该设置可实现 >150 tok/s 的输出速度。
开源前端 - /frontends
智能编码 TUI + WebUI - OpenCode
OpenCode (https://opencode.ai) 是一个终端用户界面,用于连接人类用户、语言模型和计算机终端,类似于 Anthropic 的 Claude Code (https://code.claude.com/docs/en/overview),但支持更广泛的 LLM API。
我们提供了将自托管 LLM 与 OpenCode 集成,以及在 Modal 上部署 OpenCode 服务器的说明,详见 这里。
智能助手 - OpenClaw
OpenClaw (https://docs.openclaw.ai) 是一个注重最大可集成性的智能助手系统。
我们提供了将自托管 LLM 与 OpenClaw 集成的说明,详见 这里。
聊天 Web UI - AI SDK
Vercel AI SDK (https://ai-sdk.dev/) 提供核心和 UI 两个子 SDK,用于将 JavaScript 应用与 LLM 集成。
我们展示了如何简单地将此栈与自托管 LLM 集成——包括一个“Hello World”级别的 NodeJS CLI 集成(详见 这里)和一个完整的 NextJS 应用(详见 这里)。
该应用已部署在此处 (https://jazz.modal.chat)。
聊天 CLI - llm
我们喜欢 Simon Willison 的 llm CLI 工具 (https://github.com/simonw/llm),用于在终端中快速执行 LLM 查询。
它通过与 OpenAI 模型相同的接口,支持与 OpenAI 兼容的 API 提供商(如我们的自托管 LLM)集成。文档见此处 (https://llm.datasette.io/en/stable/other-models.html)。
我们在 llm_show_reasoning 中演示了一个小插件,用于打印 LLM 的推理输出——OpenAI 推理模型不提供此功能,但开源模型可以。这能有效降低表观延迟。
相似文章
@charles_irl: 几年前,人工智能的未来看起来一片黯淡——专有模型、专有推理服务……
Modal 宣布推出 Auto Endpoints,这是一项可通过一键实现优化的开源 AI 推理的服务,旨在对抗专有模型和服务的趋势。
@nanjiangwill: 在 @modal,我们正在努力确保开源强化学习框架具备训练前沿开放权重模型所需的所有技术…
Modal 正在通过增量压缩和其他技术增强开源强化学习框架,以训练前沿开放权重模型。slime 框架将无损增量同步引入分解式训练环境。
@charles_irl: 掌控你的推理,掌控你的代理平台,掌控你的命运。在 @modal Endpoints 上使用 OpenInspect。
OpenInspect 支持完全自托管的背景代理系统,在 Modal Endpoints 上使用 GLM-5.2,强调对推理基础设施的所有权。
@charles_irl: 恰当的后训练强化学习,广泛部署,是迈向未来软件系统能悄然自我改进、适应人类需求的关键一步。
Modal 在其平台上宣布了一个开源的强化学习库,通过可扩展的部署解决后训练强化学习中的基础设施挑战。
@SigGravitas: https://x.com/SigGravitas/status/2061554698285404289
Microsoft Build 2025 将设立开源专区,展示四个开源 AI 项目:OpenClaw、AutoGPT、Open WebUI 和 prompts.chat,突出它们在个人智能体、自主智能体、本地 AI 平台和提示工程方面的作用。