mutual-evolution

标签

Cards List
#mutual-evolution

CoEvolve:通过智能体-数据互进化训练LLM智能体

arXiv cs.CL · 2026-04-20 缓存

CoEvolve提出了一个智能体-数据互进化框架,通过闭环、交互驱动的学习来训练LLM智能体,同时适配智能体和其训练数据分布。该方法从轨迹回滚中提取反馈信号以指导基于LLM的任务合成,在AppWorld和BFCL基准上的多个Qwen模型中展示了显著的改进(绝对收益15-19%)。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈