@AltimeterCap: https://x.com/AltimeterCap/status/2069094020995793283

X AI KOLs Timeline 2026/06/22 16:23 新闻

inference-market open-source-models ai-investment baseten model-supply-chain ai-economy post-trained-models

摘要

Altimeter Capital的Apoorv Agrawal解释为何他们加倍投资Baseten，认为推理将变成最大的市场，并且后训练开源模型在能力、成本和控制方面提供了最佳组合。

https://t.co/usAhXq9loh

查看原文

查看缓存全文

缓存时间: 2026/06/24 12:23

为何我们加倍押注 Baseten

作者：Apoorv Agrawal (@apoorv03)

我们于2025年第四季度投资了@Baseten，当时我写下了投资论点。六个月后，这一论点不仅更加明确，而且验证速度远超预期。到第一季度末，Baseten已超额完成我们为其设定的2026年全年预测目标。更新后的投资论点为：

我们相信推理（Inference）将成为AI领域最大的市场之一
经过后训练的开源模型能提供能力、成本与控制的最佳组合
Baseten提供了利用开源模型的完整模型供应链：在同一平台上训练、部署和服务模型
Baseten = 押注整个AI经济

推理将成为最大的市场

有些真理过于宏大，以至于需要反复强调。如果在2003年你写下“互联网将变得巨大”，正确的做法不是在2004年就就此打住，而是继续重复，因为其规模仍然被低估。

我们对推理市场有着同样的感受。我们相信，到本十年末，它将成为全球最大的市场——不只是最大的软件市场，而是所有市场中最大的市场。原因何在？因为它是AI经济的基本单元。训练创造模型，推理交付产品。

最简单的类比是电表。每当一个AI产品完成有用工作时，电表就会转动。在用户看来产品可能像软件，但其底层是源源不断的模型调用。更多用户、更长的提示词、更大的上下文窗口、更多的推理步骤、更多的工具、更多的智能体、更多的重试、更多的评估、更多的个性化——所有这些都转化为更多的推理量。

早期的AI产品大多是单轮交互：问一个问题，得到一个答案。但下一代产品不再是单轮，而是循环：检索、推理、调用工具、检查结果、重新排序、综合、验证，并且常常重复。一个用户操作可能产生数百甚至数千次推理事件。

这就是为什么我总回到同一句话：推理将成为最大的市场。

谷歌公开的Token数据提供了一个有用的方向性信号。两年前，谷歌表示其各平台每月处理9.7万亿个Token。去年这个数字变成了约480万亿。在2026年的I/O大会上，谷歌表示这个数字已增长到每月超过3.2万亿个Token。需要说明的是：这只是谷歌自己的技术栈和自有平台，并非整个市场。但它足以说明更宏观的观点：推理量的增长速度非同寻常。

经过后训练的开源模型提供能力、成本与控制的最佳组合

关于“开源与闭源”的争论，已有太多笔墨。前沿闭源模型非常出色，通常是解决最智能任务、最困难推理任务、追求模型即服务便利性以及探索新能力时的正确选择。

但对于AI原生公司而言，实际的问题有所不同：对于这个工作流，在这个质量门槛、这个延迟水平、这个成本、这个安全姿态以及这个控制程度下，哪种模型架构最优？经过后训练的开源模型可以在特定工作流中表现更优、更便宜、更快。它可以在客户环境中运行，可以通过私有评估、专有轨迹、领域特定的强化学习以及围绕它的应用框架来塑造。

两个因素正在使天平向开源后训练模型倾斜：1）Token量的指数级增长（更多能力→更多效用→更多使用）；2）所有权（这是最具战略性的因素）。企业们意识到他们的模型正在变得不可或缺，他们不希望自己的核心智能是租来的。萨提亚·纳德拉对此描述得最精妙：

“一家公司应该能够更换一个‘通才’模型，而不会失去其学习系统中内置的‘公司老手’专业知识……企业需要将他们的工作流、领域知识和积累的判断力转化为每次使用都会改进的AI系统……这个循环成为公司的新知识产权。我把它看作一个爬山机器。与大多数资产不同，它具有复利效应。”

这改变了范式：从简单挑选最佳模型转变为构建一个“学习循环”，让人力资本和Token资本共同复利。持久的IP现在就是“学习循环”：私有数据、私有评估、工作流轨迹、领域反馈、强化学习环境、产品上下文，以及随使用而改进的模型行为。

这是我们调查的AI原生公司中浮现的模式：最困难的一般智能任务使用前沿模型，高容量和专业化工作负载使用后训练开源模型。后者让AI原生公司能够拥有自己的智能，并使其最有价值的资产不断复利。

Baseten模型供应链的实际应用：Harvey案例

Harvey是一个有用的公开案例，因为法律工作具有高风险、高技能和深度案例特定性。

Harvey描述其模型策略：受Cursor的Composer启发，构建一系列法律基础模型，目标是在整个产品中以可承受的价格和强大的安全姿态提供前沿级智能，同时为律所构建专用模型并拥有自己的智能打下基础。

这整个论点就体现在一个客户模式中：许多专用模型，服务于许多专用工作流，内置于许多专用产品中。

他们围绕实际工作构建了一个模型系统。在法律领域，工作往往跨越数月，涉及大量文档、人员、判断和中间步骤。Harvey的智能体系统需要能够阅读、推理、使用工具、寻求帮助、保持上下文，并在律师实际执行的任务上不断改进。Harvey与Baseten的合作尤其有趣，因为它展示了后训练和应用框架如何结合。他们使用法律智能体基准、领域特定任务和Baseten Research，将开源模型后训练到在法律工作中接近闭源前沿的水平。

下面来自Harvey的图表展示了核心观点：通过正确的后训练和应用框架，一个小得多的开源模型可以在特定领域任务上进入前沿区间。目标不是在所有基准上击败所有前沿模型，而是以适合生产的成本、延迟和控制范围，在关键工作流上提供前沿质量的表现。Harvey指出，前沿模型每次任务大约花费50美元，延迟约20分钟。他们与Baseten的合作展示了一条路径：以更实际的成本和时间延迟，达到可比的领域特定质量。

这是我们最早在AI原生公司中看到的模式：随着模型使用变得不可或缺，他们更加关注能力、成本和控制这三要素。这个模式现在正在进入企业领域。随着大公司从实验转向生产，他们想要AI原生公司想要的东西：拥有自己的智能并可靠地运行它。企业正成为Baseten日益关注的领域，这使市场远远超出AI原生核心。

这对Baseten意味着什么

一月份，我称Baseten为“推理领域的Stripe”，我仍然喜欢这个类比。Stripe让支付变得可编程，抽象掉了混乱的金融基础设施，使构建者能够专注于产品。Baseten对推理也做了同样的事：部署、自动扩缩、路由、可观测性、运行时优化、容量、安全和生产支持。

这个服务正在进化。AI原生公司不会只运行一个模型。他们将运行数百万个由模型驱动的工作流，每个工作流可能由不同的模型最佳交付。因此现在需要的是完整的模型供应链：引入任何模型，在私有数据和评估上进行后训练，跨硬件和云进行部署和自动扩缩，路由和观测，然后将生产轨迹反馈到下一个版本。这个循环正是AI原生公司所需要的，而他们中几乎没有人想自己构建。他们不想要一个100人的GPU平台团队去谈判配额、调试内核并拼凑五个供应商。他们想构建自己的产品，而Baseten让他们能够做到。

免责声明：https://www.altimeter.com/terms

本文及所呈现的信息仅供信息参考。文中表达的观点仅代表作者本人，不构成任何证券的出售要约、购买推荐或买入邀请，也不构成对任何投资产品或服务的推荐。虽然本文中的某些信息来自可靠来源，但作者及其雇主或关联方并未独立验证这些信息，无法保证其准确性和完整性。因此，对本信息的公平性、准确性、及时性或完整性，不作任何明示或暗示的陈述或保证，也不应依赖于此。作者及所有雇主和关联方对本信息不承担任何责任，也没有义务更新本文中的信息或分析。

@AltimeterCap: https://x.com/AltimeterCap/status/2069094020995793283

为何我们加倍押注 Baseten

相似文章

@tuhinone: https://x.com/tuhinone/status/2069089174494625907

@alina_weinstein: 推理正在成为世界上最大的市场，而且它仍在建设之中。Baseten 每天处理超过10亿次推理调用……

AI推理初创公司Baseten据报道在上一轮巨额融资数月后再次融资15亿美元

估值130亿美元的AI初创公司押注更便宜的OpenAI和Anthropic替代方案（4分钟阅读）

@rhythmrg: https://x.com/rhythmrg/status/2066561780495896785

提交意见反馈