self-generated-data

标签

Cards List
#self-generated-data

在中间训练阶段使用自生成数据可提升语言模型中强化学习的性能

arXiv cs.AI · 2026-05-12 缓存

本文探讨了在大型语言模型的中间训练阶段使用多样化的自生成数据如何提高强化学习的有效性,尤其是在推理任务方面。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈