experience-internalization

标签

Cards List
#experience-internalization

重新思考自进化大语言模型智能体的持续经验内化

arXiv cs.CL · 昨天 缓存

本文研究了大语言模型智能体在多轮迭代经验内化过程中出现能力渐进式崩溃的原因,并提出了一套从经验粒度、注入模式和训练机制三个维度出发的鲁棒解决方案。主要发现包括:原则级经验、逐步注入方式以及离策略上下文蒸馏能够带来更稳定、更可持续的持续学习效果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈