hill-climbing-machine

#hill-climbing-machine

@natashajaques：非常喜欢阅读微软MAI-Thinking-1的《Building a Hill Climbing Machine》论文。令人惊讶的是他们公开了……

X AI KOLs Following ↗ · 6天前缓存

Natasha Jaques赞扬微软MAI-Thinking-1论文完全公开了前沿模型的训练方法，重点指出预训练、中期训练和RL后训练阶段的token分布，并提到Yann LeCun的蛋糕比喻很有先见之明。

0 人收藏 0 人点赞