@sherryyangML:机器学习工程(MLE)正成为新的智能体前沿。我将分享我们在扩展面向MLE智能体的强化学习方面的成果……

X AI KOLs Following 论文

摘要

ICLR 2026 的两篇论文展示了小型 RL 训练智能体如何在机器学习工程任务上击败前沿模型,以及 MLE-Smith 如何自动扩展 MLE 工作负载。

机器学习工程(MLE)正成为新的智能体前沿。我将在 #ICLR2026 分享我们在扩展面向 MLE 智能体的强化学习方面的成果:1)小型模型的 RL 训练结果优于前沿模型 http://arxiv.org/abs/2509.01684 2)MLE-Smith:自动扩展 MLE 任务 http://arxiv.org/abs/2510.07307
查看原文

相似文章

MLE-bench:评估机器学习代理在机器学习工程中的表现

OpenAI Blog

# MLE-bench:评估机器学习代理在机器学习工程中的表现 来源:[https://openai.com/index/mle-bench/](https://openai.com/index/mle-bench/) OpenAI 评估机器学习代理在机器学习工程中的表现 我们推出了 MLE-bench,这是一个用于衡量 AI 代理在机器学习工程中表现如何的基准。为此,我们从 Kaggle 精选了 75 个与 ML 工程相关的竞赛,创建了一个多样化的具有挑战性的任务集合,用于测试真实的 ML 工程