knowledge-reasoning

#knowledge-reasoning

从“弱”信号到强模型：利用LoRA合并进行偏好差值聚合

arXiv cs.AI ↗ · 5天前缓存

本文介绍了偏好差值聚合（PDA）和几何对齐合并（GAM），通过LoRA合并将来自弱模型对的多个“弱”偏好信号进行聚合，在知识推理和智能体搜索任务上平均将强LLM的性能提升超过6%。

0 人收藏 0 人点赞