@VukRosic99: GLM 5.2 后训练代码已开源 (slime) Megatron-LM 进行训练。SGLang 生成 rollout。单数据缓冲…

X AI KOLs Timeline 模型

摘要

GLM 5.2 后训练代码已开源,使用 Megatron-LM 进行训练,SGLang 生成 rollout,形成一个持续强化学习循环,权重同步。

GLM 5.2 后训练代码已开源 (slime) Megatron-LM 进行训练。SGLang 生成 rollout。单数据缓冲区将它们连接成一个连续强化学习循环,每一步后权重同步。 下面是我的技术文章。https://t.co/v6fhZ19aqP
查看原文
查看缓存全文

缓存时间: 2026/06/28 03:59

GLM 5.2 后训练代码已开源 (slime)

Megatron-LM 负责训练,SGLang 负责生成 rollout。通过一个统一的数据缓冲区,两者连接成连续的强化学习循环,每一步都会同步回传权重。

以下是我的技术详解。https://t.co/v6fhZ19aqP

相似文章

GLM-5.2 可能是目前最强大的纯文本开放权重大语言模型

Simon Willison's Blog

中国AI实验室Z.ai发布了GLM-5.2,这是一个拥有7530亿参数的开放权重大语言模型,支持100万token的上下文窗口,采用MIT许可证。该模型在Artificial Analysis Intelligence Index上获得最高分,并在Code Arena WebDev排行榜上排名第二。

PSA: unsloth/GLM-5.2-GGUF 正在上传

Reddit r/LocalLLaMA

unsloth 已将 GLM-5.2 的 GGUF 版本上传至 Hugging Face,为 llama.cpp、vLLM 和 SGLang 等多种推理引擎提供了可直接使用的模型文件。