finetuning

标签

Cards List
#finetuning

@adithya_s_k: 你现在可以直接用 TRL 对模型在智能体轨迹上进行微调:Claude Code 轨迹、Codex 轨迹、OpenClaw 轨迹、Pi 轨迹……

X AI KOLs Following · 3天前 缓存

TRL 现在支持对来自各种来源(如 Claude Code、Codex、OpenClaw 和 Pi)的智能体轨迹进行模型微调,这正朝着训练智能体模型的标准化栈迈进。

0 人收藏 0 人点赞
#finetuning

GGT-100K:可泛化真实图像修复的生成式真实标注

Hugging Face Daily Papers · 2026-05-29 缓存

本文介绍了GGT-100K,一个包含103,707对图像的真实图像修复数据集,通过使用如Nano-Banana-2等多模态基础模型,从低质量输入生成高质量目标。实验表明,该数据集提升了多种图像修复模型的泛化能力。

0 人收藏 0 人点赞
#finetuning

无需代码的LLM微调

Reddit r/AI_Agents · 2026-05-19

本文讨论如何让非编程人员也能进行LLM微调,重点展示了一段视频演示,说明任何人都可以在无需编码的情况下定制LLM。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈