@rhythmrg: https://x.com/rhythmrg/status/2066561780495896785

X AI KOLs Timeline 新闻

摘要

文章认为,企业应该对自定义AI模型进行后训练,用于关键任务、高容量的用例,以实现差异化、节省成本并对权衡进行控制,而不是仅仅依赖通用前沿模型。

https://t.co/vWjJJZFj6s
查看原文
查看缓存全文

缓存时间: 2026/06/16 01:12

你应该后训练自己的模型吗?

通用前沿模型(无论是开源还是闭源)正在快速改进。在很多情况下,它们是正确的起点。如果你在构建一个从0到1的原型、尝试理解某个工作流程,或者让系统初步跑通,你应该使用可用的最强通用模型,并快速推进。

但对于那些对你的公司使命、产品和利润率至关重要的少数幂律用例,答案越来越倾向于:是的,你应该后训练自己的模型。

你最重要的用例通常也是你的差异化数据所在之处。这些用例中,你的用户会留下操作轨迹,你的专家会做出判断,你的系统会记录结果,而你的业务对“好“有具体的定义——通用模型并不共享这个定义。前沿模型可以帮你起步,但它不会自动学习那些让你的公司与众不同的私有运营知识。

当用例在成本、延迟、可靠性或产品体验方面有硬性约束时,这一点尤为突出。通用模型会把你锁定在这些特性之间的某一种权衡方案中。而后训练赋予你主动权:你可以推动模型在你特定任务上表现更强,同时改善成本和延迟。

定制模型可以意味着以极低的成本获得前沿级别的质量。可以意味着延迟低到足以将智能直接嵌入实时用户操作流中。还可以意味着模型能够持续运行,因为经济账终于算得过来了。例如,一个在漏洞检测方面成本低10倍的定制模型,不仅更便宜,还能催生一个持续扫描而非偶尔扫描的新产品。

这就是为什么领先的AI原生公司——其中许多是我们的合作伙伴——正在率先行动。作为当前最大的token消耗者,他们明白走向定制化所面临的财务和战略压力。更广泛的企业市场最终也会得出同样的结论。

公司不会对一切进行后训练,也不应该这样做。大多数用例将继续使用通用模型、检索、工具和编排。但那些定义公司差异化的“核心“工作流程,不应永久外包给一个租来的通才模型。如果这样做,公司实际上是在将自己的差异化商品化,因为每个竞争对手都能使用同样的通用模型。

如果你每年在某个关键功能的前沿推理上花费1亿美元,那么将这部分工作负载转移到你自己拥有的定制模型上,将是你的公司能够承担的最高杠杆项目之一。

但这也是一项严肃的技术工程。已有数十家公司推出了自助训练端点,而它们之所以很少成为默认路径,是因为训练栈只是问题的一部分。工作不仅仅是调用一个训练API。

你的产品、工程和研究团队需要协同工作,来确定训练内容、如何构建合适的环境、如何定义成功、如何将该定义转化为稳健的奖励信号、什么样的评估具有代表性、应用哪种后训练技术,以及模型投入生产后如何持续改进。这就是为什么我们与客户的合作是前向部署的,并且全部构建在我们的平台之上——该平台支持从任务创建到应用前沿后训练技术的端到端流程。

未来几年,企业在部署AI系统并在其产品和运营中服务模型时,将花费数千亿美元。少数幂律用例将占据这些支出的不成比例份额,而针对这些用例优化的定制模型将驱动投资回报率和差异化。

简而言之——如果满足以下条件,你应该针对某个用例后训练自己的私有模型:

  • 你拥有该用例特定的专有数据。
  • 该用例的推理量很高。
  • 该用例是任务关键型的,值得差异化。

在此过程中,请确保你:

  • 构建反映你实际“好“的定义的评估和奖励信号。
  • 选择与问题匹配的后训练方法。
  • 对你的生产部署进行仪表化,以便模型在使用过程中不断改进。

相似文章

@oneill_c: https://x.com/oneill_c/status/2054604986269802579

X AI KOLs Timeline

文章指出,严肃的AI公司正从封装通用模型转向使用专有交互数据训练自己的专业化模型,因为在分布内智能体任务中,专业化现在经常能匹配甚至超越前沿模型,从而推动更好的单位经济效益。

Moats Need Models(6分钟阅读)

TLDR AI

本文认为,AI的可防御性来自于拥有完整的反馈循环——基于专有数据进行后训练的自定义模型,针对特定工作流进行调整,并由用户定义的标准进行评估——而不是从可能随时更改条款的供应商那里租用前沿API。它强调模型定制是实现差异化和利润控制的关键。