标签
讨论实例表示学习中的损失函数,重点介绍使用 NCE 来近似计算不可行的 MLE 目标。
ICLR 2026 的两篇论文展示了小型 RL 训练智能体如何在机器学习工程任务上击败前沿模型,以及 MLE-Smith 如何自动扩展 MLE 工作负载。