automated-experimentation

标签

Cards List
#automated-experimentation

利用专家代理进行自动研究:开发高效且非平凡的训练配方

Hugging Face Daily Papers · 2026-05-07 缓存

本文介绍了一种自动研究框架,利用专家代理通过代码执行与反馈的经验闭环,迭代优化训练配方。该系统借助谱系反馈(lineage feedback),无需人工干预,即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈