gram-matrix

标签

Cards List
#gram-matrix

Gram Newton-Schulz:一种用于Muon的快速、硬件感知的牛顿-舒尔茨算法

Hacker News Top · 6天前 缓存

本文介绍了Gram Newton-Schulz,这是对Muon优化器中使用的牛顿-舒尔茨正交化过程的一种硬件感知优化,能够在保持模型质量的同时显著加速大型语言模型的训练。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈