parameter-alignment

#parameter-alignment

参数对齐缓解多语言专家语言模型中的灾难性遗忘

arXiv cs.CL ↗ · 3天前缓存

本文研究了持续预训练过程中多语言专家语言模型面临的灾难性遗忘问题，并提出了五种参数对齐策略（硬层冻结、软正则化、事后权重还原和模型合并），以在32种训练语言中最小化语言习得成本的同时减轻遗忘。

0 人收藏 0 人点赞