标签
DeepRefine 是一篇研究论文,介绍了一种基于大语言模型的推理模型,该模型利用强化学习和多轮交互来精炼智能体编译的知识库,从而提高下游任务的性能。
DAIR Academy 将于 2026 年 5 月 21 日举办一场免费直播,演示构建视觉 LLM 产物以增强知识库的框架。