@modal: https://x.com/modal/status/2057527310123770008

X AI KOLs Following 新闻

摘要

Modal 在由 General Catalyst 和 Redpoint 领投的 C 轮融资中筹集了 3.55 亿美元,估值达 46.5 亿美元,以扩展其专注于AI的云平台。该公司自9月以来增长了五倍,年化收入突破3亿美元。

https://t.co/5DZKxwdGY5
查看原文
查看缓存全文

缓存时间: 2026/05/21 19:36

Modal C轮融资:3.55亿美元,估值46.5亿美元

我们刚刚完成了3.55亿美元的融资,自9月以来业务增长了五倍,年化营收已突破3亿美元。本轮融资后估值为46.5亿美元,由 @generalcatalyst 和 @Redpoint 领投,@MenloVentures 和 @Accel 作为新投资者加入。所有现有主要投资方也全部参与,进一步加注对Modal的信心。

AI时代的新基础设施层

我们创立Modal,是因为为传统Web应用构建的云端从来无法适配AI工作负载。在生成式AI革命之前我们就已看清这一点,而随着模型和技术的进步,这一事实愈发凸显。

Modal是一个为AI而生的云平台。它不是单一的GPU云,而是一个提供正确原语的平台,让开发者能够构建极其广泛的应用。如今,这体现为低延迟弹性推理、动态智能体运行时、强化学习、大规模批处理作业,等等等等。

从前沿API到模型自主掌控

从DoorDash这样的数字原生企业,到Reducto这样的AI原生公司,领先的团队正在自主掌握模型。他们用自有数据微调模型,运行强化学习,并根据自身的延迟、吞吐量和成本需求优化推理。DeepSeek、Qwen等开源权重模型已达到生产级质量,vLLM和SGLang等推理引擎也同步成熟。第一次,从拥有模型到服务模型的完整技术栈已就位,且无需牺牲能力。

Modal同时驱动着我们的强化学习基础设施和生产推理。一端是数百万个沙箱,另一端是实时服务。全部运行在同一平台上。——ScottWu46, Cognition CEO

Decagon能够在p90延迟342ms下运行,远低于自然对话所需的亚秒级要求,实现了速度、效率和企业级可靠性。——DecagonAI

智能体需要更好的执行环境

2023年,我们开始看到用户在Modal上运行AI生成的代码。很明显这将成为一种普遍需求,因此我们构建了Sandboxes——用于运行不受信任代码的隔离环境——作为一等原语。爆炸性增长花了两年时间才到来。

过去六个月里,情况变得清晰:智能体将无处不在,而当它们拥有运行时环境时,会强大得多。DoorDash正在为商家构建AI智能体,像Ramp的Inspect这样的编码智能体贡献了70%的合并PR,强化学习工作负载并行运行数千个环境,自动研究智能体大规模爬取网络。Modal上已启动超过10亿个沙箱。

沙箱是强化学习最重要的构建块之一。Modal显然非常灵活,结构设计让我们能够构建这些复杂环境,专注于性能和可靠性。——ypatil125, AppliedCompute CEO

如果没有Modal,构建Inspect会非常困难。大量复杂性被隐藏,只需快速启动沙箱,加载大量服务和数据,并在任意时刻拥有无限数量的沙箱。——rahulgs, Ramp应用AI主管

AI的形态在不断扩展

Modal是一个通用的计算平台,专为AI工作负载的基础需求而构建:弹性计算、安全隔离和可编程控制。开发者将它们组合成截然不同的应用。Physical Intelligence为实时机器人运行推理。Chai Discovery将药物发现管线从蛋白质嵌入扩展到抗体设计。Suno每天生成数百万首歌曲,从扩展到数千个GPU再回落到接近零。相同的原语,完全不同的形态。

我们使用Modal运行边缘推理,开销小于10毫秒,并大规模运行批处理作业。团队喜欢这个平台,因为它赋予我们强大的能力和灵活性。——Brian Ichter, Physical Intelligence联合创始人

这不只是节省时间,而是消失的心智负担。有了Modal,我们只需要给需要扩展的函数添加几个装饰器,然后忘掉它们,它们就能正常工作。——Kevin Wu, Chai Discovery ML研究员

我们接下来要构建什么

过去五年,我们在技术上投入极深,包括从头构建我们自己的存储和计算层。这让我们实现了看似不可能的结果:例如通过GPU快照将冷启动速度提升100倍,全球范围内的弹性低延迟推理,以及通过汇聚全球数百个数据中心的容量,在无需预留的情况下,从0扩展到1000个GPU只需几分钟(甚至几秒钟!)。

因为我们拥有完整的技术栈,我们可以继续在这些优势上构建,为开发者提供越来越好的体验。

这个基础使得下一阶段成为可能。以下是我们的方向:

大规模低延迟推理。

生产推理的门槛不断提高,我们正在加倍投入,让团队能够快速迭代:更好的服务原语、更清晰的观测能力,以及对开源推理栈的持续投入。我们已经组建了一支推理工程师团队,为Flash Attention、vLLM、SGLang等做出贡献,因为性能提升应该回馈给使用相同引擎的社区。

训练与推理循环的融合。

强化学习是一个棘手的基础设施问题。多节点训练、弹性推理和沙箱已经在Modal上获得一等支持,这使得完整的强化学习循环自然而然地适配。我们的用户已经在质量、成本、延迟和吞吐量上看到了帕累托高效的结果。我们希望让完整的模型训练生命周期——从首次微调到生产服务——对更多团队触手可及。

面向智能体的计算层。

沙箱已经贡献了我们超过三分之一的收入,客户不断要求更多。我们正在扩展沙箱的能力范围,并提升规模以支持数百万个沙箱并行运行。同时,我们认识到智能体开发时代已经到来。Modal本质上是代码,这已经使其成为智能体工作的绝佳场所。我们将继续改进,首先推出细粒度的RBAC,让客户能够安全地赋予智能体能力。

AI基础设施层才刚刚开始。我们也是。

如果你想加入我们位于纽约、旧金山和斯德哥尔摩的120+人团队,请查看我们的在招职位。

相似文章