megatron

标签

Cards List
#megatron

@plugyawn: 介绍:Megaprop:一个跨GPU高效预条件优化的库!Megaprop 是 Megatron 的一个分支……

X AI KOLs Following · 4天前 缓存

Megaprop 是一个新的库,用于跨 GPU 的高效预条件优化,它源自 Megatron 和 TransformerEngine,支持 FSDP 下的 Muon、FOOF、KFAC 和 Newton-Muon,并支持 MuP 以实现宽度和深度的优化。

0 人收藏 0 人点赞
#megatron

@charles_irl: 祝贺我的同事 @nanjiangwill 将这个重要技术合并到 slime 中!

X AI KOLs Following · 2026-05-30 缓存

增量压缩权重同步技术已合并到 slime 中,实现 Megatron ↔ SGLang 分离式部署的无损增量同步,增强大规模强化学习。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈