@charles_irl: 掌控你的推理,掌控你的代理平台,掌控你的命运。在 @modal Endpoints 上使用 OpenInspect。
摘要
OpenInspect 支持完全自托管的背景代理系统,在 Modal Endpoints 上使用 GLM-5.2,强调对推理基础设施的所有权。
掌控你的推理,掌控你的代理平台,掌控你的命运。
在 @modal Endpoints 上使用 OpenInspect。
查看缓存全文
缓存时间: 2026/06/24 16:04
掌控你的推理,掌控你的智能体平台,掌控你的命运。
在 @modal Endpoints 上运行 OpenInspect。
cole murray (@colemurray): OpenInspect 搭配 Modal Inference (GLM-5.2)
完全自托管的背景智能体系统,以 FP8 精度运行 GLM 5.2。速度飞快!
掌控你的关键基础设施
相似文章
@modal:现在真正拥有你的推理还为时不晚。介绍:Modal Auto Endpoints。
Modal 宣布推出 Auto Endpoints,这是一个用于拥有和部署 AI 推理的新功能。
@charles_irl: 几年前,人工智能的未来看起来一片黯淡——专有模型、专有推理服务……
Modal 宣布推出 Auto Endpoints,这是一项可通过一键实现优化的开源 AI 推理的服务,旨在对抗专有模型和服务的趋势。
Modal Auto Endpoints:你掌控的优化推理
Modal推出了Auto Endpoints,这是一项自助服务,提供优化的、生产级的LLM推理,具备完整代码所有权、透明指标和自动缩放功能,构建于其无服务器GPU基础设施之上。
@charles_irl: 当你们在封装OpenAI时,我研究了𝕋𝕙𝕖 ℂ𝕌𝔻𝔸 当你们在进行风投对话时,我掌握了𝔗𝔥𝔢 ℑ𝔫𝔣𝔢𝔯𝔢𝔫…
Modal Jazz 是一个完整的开源AI堆栈,使用Modal、DeepSeek V4 Pro和SGLang进行自托管语言模型推理,前端包括OpenCode、OpenClaw和Vercel AI SDK。
@aiDotEngineer: 您的智能体现在可以训练模型。来自@mervenoyann 的观点:开源模型已经迎头赶上。GLM 5.1 在人工智能分析指数上领先……
@mervenoyann 的演讲展示了开源模型(如 GLM 5.1)已赶上闭源模型,并说明了 Hugging Face 生态系统如何让智能体训练模型、执行推理和构建工作流。