标签
TRL 现在支持对来自各种来源(如 Claude Code、Codex、OpenClaw 和 Pi)的智能体轨迹进行模型微调,这正朝着训练智能体模型的标准化栈迈进。
本文介绍了GGT-100K,一个包含103,707对图像的真实图像修复数据集,通过使用如Nano-Banana-2等多模态基础模型,从低质量输入生成高质量目标。实验表明,该数据集提升了多种图像修复模型的泛化能力。
本文讨论如何让非编程人员也能进行LLM微调,重点展示了一段视频演示,说明任何人都可以在无需编码的情况下定制LLM。