mutual-evolution

#mutual-evolution

CoEvolve：通过智能体-数据互进化训练LLM智能体

arXiv cs.CL ↗ · 2026-04-20 缓存

CoEvolve提出了一个智能体-数据互进化框架，通过闭环、交互驱动的学习来训练LLM智能体，同时适配智能体和其训练数据分布。该方法从轨迹回滚中提取反馈信号以指导基于LLM的任务合成，在AppWorld和BFCL基准上的多个Qwen模型中展示了显著的改进（绝对收益15-19%）。

0 人收藏 0 人点赞