knowledge-reasoning

标签

Cards List
#knowledge-reasoning

从“弱”信号到强模型:利用LoRA合并进行偏好差值聚合

arXiv cs.AI · 5天前 缓存

本文介绍了偏好差值聚合(PDA)和几何对齐合并(GAM),通过LoRA合并将来自弱模型对的多个“弱”偏好信号进行聚合,在知识推理和智能体搜索任务上平均将强LLM的性能提升超过6%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈