optimizer

标签

Cards List
#optimizer

Pion:一种通过正交等价变换保持谱的优化器

Hugging Face Daily Papers · 昨天 缓存

本文介绍了 Pion,这是一种用于大语言模型训练的的新型谱保持优化器。它利用正交等价变换在权重更新过程中维持奇异值,从而提供与标准优化器相当的稳定性能。

0 人收藏 0 人点赞
#optimizer

@0xLogicrw: Tilde Research 发现,被 DeepSeek V4、Kimi K2.5、GLM-5 等头部模型采用的优化器 Muon 有一个隐藏缺陷:它会在训练早期让 MLP 层超过四分之一的神经元永久死亡。团队据此设计了替代优化器 Auro…

X AI KOLs Timeline · 3天前

Tilde Research 发现 Muon 优化器存在导致 MLP 神经元早期死亡的缺陷,并开源了替代方案 Aurora。Aurora 在保持正交性的同时解决了神经元死亡问题,显著提升了训练效率。

0 人收藏 0 人点赞
#optimizer

AdaPreLoRA:Adafactor 预条件低秩适应

Hugging Face Daily Papers · 4天前 缓存

AdaPreLoRA 是一种新颖的 LoRA 优化器,它利用 Adafactor 对角 Kronecker 预条件来改进因子空间更新,同时保持低内存占用,在各种大语言模型(LLM)和任务中表现出具有竞争力的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈