loss-prediction

标签

Cards List
#loss-prediction

@percyliang: 我们不仅希望训练出一个好模型,还希望在开始训练之前就知道它会很好。大约一个月前…

X AI KOLs Following · 2026-05-24 缓存

Marin团队预先注册了一个129B参数MoE模型训练运行的预测损失为2.252,实际结果为2.234,展示了在训练前准确预测损失的能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈