baidu-research

标签

Cards List
#baidu-research

SimReg:通过嵌入相似性正则化在预训练阶段实现更高性能

arXiv cs.CL · 2026-05-12 缓存

本文介绍了 SimReg,这是一种用于大语言模型预训练的正则化技术,利用嵌入相似性可将训练收敛速度提高 30% 以上,并显著提升零样本性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈