automated-experimentation

#automated-experimentation

利用专家代理进行自动研究：开发高效且非平凡的训练配方

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

本文介绍了一种自动研究框架，利用专家代理通过代码执行与反馈的经验闭环，迭代优化训练配方。该系统借助谱系反馈（lineage feedback），无需人工干预，即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。

0 人收藏 0 人点赞