@rhythmrg: https://x.com/rhythmrg/status/2066561780495896785

X AI KOLs Timeline 2026/06/15 16:41 新闻

post-training custom-models ai-strategy differentiation enterprise-ai inference-cost proprietary-data

摘要

文章认为，企业应该对自定义AI模型进行后训练，用于关键任务、高容量的用例，以实现差异化、节省成本并对权衡进行控制，而不是仅仅依赖通用前沿模型。

https://t.co/vWjJJZFj6s

查看原文

查看缓存全文

缓存时间: 2026/06/16 01:12

你应该后训练自己的模型吗？

通用前沿模型（无论是开源还是闭源）正在快速改进。在很多情况下，它们是正确的起点。如果你在构建一个从0到1的原型、尝试理解某个工作流程，或者让系统初步跑通，你应该使用可用的最强通用模型，并快速推进。

但对于那些对你的公司使命、产品和利润率至关重要的少数幂律用例，答案越来越倾向于：是的，你应该后训练自己的模型。

你最重要的用例通常也是你的差异化数据所在之处。这些用例中，你的用户会留下操作轨迹，你的专家会做出判断，你的系统会记录结果，而你的业务对“好“有具体的定义——通用模型并不共享这个定义。前沿模型可以帮你起步，但它不会自动学习那些让你的公司与众不同的私有运营知识。

当用例在成本、延迟、可靠性或产品体验方面有硬性约束时，这一点尤为突出。通用模型会把你锁定在这些特性之间的某一种权衡方案中。而后训练赋予你主动权：你可以推动模型在你特定任务上表现更强，同时改善成本和延迟。

定制模型可以意味着以极低的成本获得前沿级别的质量。可以意味着延迟低到足以将智能直接嵌入实时用户操作流中。还可以意味着模型能够持续运行，因为经济账终于算得过来了。例如，一个在漏洞检测方面成本低10倍的定制模型，不仅更便宜，还能催生一个持续扫描而非偶尔扫描的新产品。

这就是为什么领先的AI原生公司——其中许多是我们的合作伙伴——正在率先行动。作为当前最大的token消耗者，他们明白走向定制化所面临的财务和战略压力。更广泛的企业市场最终也会得出同样的结论。

公司不会对一切进行后训练，也不应该这样做。大多数用例将继续使用通用模型、检索、工具和编排。但那些定义公司差异化的“核心“工作流程，不应永久外包给一个租来的通才模型。如果这样做，公司实际上是在将自己的差异化商品化，因为每个竞争对手都能使用同样的通用模型。

如果你每年在某个关键功能的前沿推理上花费1亿美元，那么将这部分工作负载转移到你自己拥有的定制模型上，将是你的公司能够承担的最高杠杆项目之一。

但这也是一项严肃的技术工程。已有数十家公司推出了自助训练端点，而它们之所以很少成为默认路径，是因为训练栈只是问题的一部分。工作不仅仅是调用一个训练API。

你的产品、工程和研究团队需要协同工作，来确定训练内容、如何构建合适的环境、如何定义成功、如何将该定义转化为稳健的奖励信号、什么样的评估具有代表性、应用哪种后训练技术，以及模型投入生产后如何持续改进。这就是为什么我们与客户的合作是前向部署的，并且全部构建在我们的平台之上——该平台支持从任务创建到应用前沿后训练技术的端到端流程。

未来几年，企业在部署AI系统并在其产品和运营中服务模型时，将花费数千亿美元。少数幂律用例将占据这些支出的不成比例份额，而针对这些用例优化的定制模型将驱动投资回报率和差异化。

简而言之——如果满足以下条件，你应该针对某个用例后训练自己的私有模型：

你拥有该用例特定的专有数据。
该用例的推理量很高。
该用例是任务关键型的，值得差异化。

在此过程中，请确保你：

构建反映你实际“好“的定义的评估和奖励信号。
选择与问题匹配的后训练方法。
对你的生产部署进行仪表化，以便模型在使用过程中不断改进。

@rhythmrg: https://x.com/rhythmrg/status/2066561780495896785

你应该后训练自己的模型吗？

相似文章

@oneill_c: https://x.com/oneill_c/status/2054604986269802579

@GokuMohandas: https://x.com/GokuMohandas/status/2066853420326384055

@charliewarren: https://x.com/charliewarren/status/2062204573549490516

Moats Need Models（6分钟阅读）

专业化胜过规模化：大多数AI采购决策忽略的一个战略变量

提交意见反馈