model-progress

#model-progress

@OpenAI: 我们来聊聊评估。我们一直在寻找更好的方法来衡量和预测模型的进展，尤其是在基准测试...

X AI KOLs ↗ · 2026-06-16 缓存

OpenAI讨论了评估（evals）的重要性，用于衡量和预测模型进展，尤其是在基准测试变得饱和或被操纵的情况下，并邀请了Tejal Patwardhan和Andrew Mayne分享见解。

0 人收藏 0 人点赞