标签
该帖子概述了一个未来智能体配方,通过微调高效、专业化的开源模型,在LLM-as-a-judge任务上超越前沿性能,并将其应用于从追踪数据中提取信号以实现持续学习。LangChain Labs 和 FireworksAI 发布了展示这一方法的新工作。
本文介绍了FewRS,一种基于重采样的方法,它大幅减少了统计可靠数据挖掘所需的重采样数据集数量,在保持严格错误发现控制和高统计功效的同时,实现了高达两个数量级的加速。
C-Mining提出了一个无监督框架,通过利用嵌入空间中的跨语言几何错位来发现LLM训练数据中的文化种子,实现可扩展的合成数据生成以支持文化对齐,无需手动或LLM监督。