weight-averaging

标签

Cards List
#weight-averaging

ORBIT:通过原点调控合并保留GenRetrieval中的基础语言能力

Hugging Face Daily Papers · 2026-05-12 缓存

ORBIT提出了一种方法,通过跟踪参数距离并使用权重平均,缓解了为生成式检索微调的大语言模型中的灾难性遗忘,优于常见的持续学习基线。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈