标签
本文介绍了一种名为ISE的三阶段合成范式,用于生成带有基于执行的多轮操作系统代理轨迹,并证明在生成的ISE-Trace数据集上进行微调能显著提升代理在ClawEval上的性能。
本文研究了基于执行的自动化AI研究,通过构建一个自动执行器来实现LLM生成的想法并运行实验。结果表明,执行引导的进化搜索可以找到在预训练和后训练任务中显著优于基线的方法。