scale-vectors

标签

Cards List
#scale-vectors

体积微小,效果显著:大语言模型中的缩放向量研究

Hugging Face Daily Papers · 2026-05-26 缓存

本文系统地研究了LLM归一化层中的缩放向量,揭示了它们通过自放大预条件效应优化训练,并提出了三种轻量级改进方案,在几乎不增加开销的情况下提升性能和扩展行为。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈