@WilliamBarrHeld: 要训练更好的开源模型，我们需要可预测的缩放。Delphi 是 Marin 迈出的第一步：我们预训练了许多小模型……

X AI KOLs Following 2026/05/11 19:25 论文

摘要

由 William Barr Held 领导的 Marin AI 研究团队推出了 Delphi，这是一种通过预训练小模型来准确预测更大规模 25B 参数训练结果的方法论。该研究旨在建立可预测的缩放规律，以实现更高效的人工智能开源模型开发。

要训练更好的开源模型，我们需要可预测的缩放。 Delphi 是 Marin 迈出的第一步：我们使用同一套方案预训练了许多小模型，然后外推 300 倍，以仅 0.2% 的误差预测了 25B 参数 / 600B token 的训练任务。为此我们付出了不少努力 🧵 https://t.co/HmlVFl11ag

查看原文

查看缓存全文

缓存时间: 2026/05/11 20:43

为了训练更好的开源模型，我们需要可预测的扩展性。

Delphi 是 Marin 迈出的第一步：我们使用同一套配方预训练了许多小型模型，随后进行了 300 倍外推，以预测一次 25B 参数 / 600B Token 的训练任务，误差仅为 0.2%。

为此我们付出了不少努力 🧵 https://t.co/HmlVFl11ag

@WilliamBarrHeld: 要训练更好的开源模型，我们需要可预测的缩放。Delphi 是 Marin 迈出的第一步：我们预训练了许多小模型……

相似文章

从零开始开发开源大语言模型：从预训练到RLHF（PPO/GRPO）

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

微调 API 功能改进和自定义模型项目扩展

API 中的模型蒸馏

扩展我们构建和测试最先进 AI 的方式

提交意见反馈