@charles_irl: 祝贺我的同事 @nanjiangwill 将这个重要技术合并到 slime 中!

X AI KOLs Following 工具

摘要

增量压缩权重同步技术已合并到 slime 中,实现 Megatron ↔ SGLang 分离式部署的无损增量同步,增强大规模强化学习。

祝贺我的同事 @nanjiangwill 将这个重要技术合并到 slime 中!
查看原文
查看缓存全文

缓存时间: 2026/05/31 02:32

恭喜我的同事 @nanjiangwill 成功将这一重要技术合并到 slime 中!

slime (@slime_framework): @FireworksAI_HQ 和 @cursor_ai 强调了为什么在前沿规模的强化学习中,增量压缩权重同步至关重要。

slime 将这一能力带到了开源社区:用于 Megatron ↔ SGLang 解耦的无损增量同步——传输增量,而非完整检查点。

这是朝着完全 … 迈出的又一步。

相似文章

@ying11231:在TPU上令人印象深刻的性能。

X AI KOLs Timeline

LMSYS Org 的一篇博客文章详细介绍了使用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T(一个 1 万亿参数的混合 MoE 模型),通过单个 Pallas 内核将 MoE 数据移动隐藏在计算之后,从而实现高效的推理。