@NielsRogge: GLM-5.2 是 PostTrainBench 上名副其实的 SOTA,击败了 GPT-5.5 和 Opus 4.8。了解更多:https://paperswithcode.co/be…
摘要
GLM-5.2 在 PostTrainBench 上取得了最先进的结果,超越了 GPT-5.5 和 Opus 4.8。
GLM-5.2 是 PostTrainBench 上名副其实的 SOTA,击败了 GPT-5.5 和 Opus 4.8。了解更多:https://paperswithcode.co/benchmark/posttrainbench…
相似文章
@mervenoyann: GLM-5.2 与 Opus 4.8 相当,具有 1M 上下文 > 新的 IS 注意力每 4 个稀疏层重用一次索引器(2.9× 每…)
GLM-5.2 是一款可与 Opus 4.8 相媲美的新模型,具有 1M 上下文、新的 IS 注意力机制、改进的推测解码和灵活的思考努力级别。它已在 MIT 许可证下发布,并在 transformers、vLLM 和 SGLang 中提供 Day-0 支持。
@Sentdex: Zai非常慷慨地给了我一个密钥来测试GLM 5.2。我在几个简单任务上试用后,很快意识到这一点……
Sentdex报告称,Zai的GLM 5.2是首个能够在许多任务上取代GPT-5.5和Opus 4.8的开源模型,具有强大的编码和代理性能,以及1M上下文窗口。
GLM 5.2 API 已上线,权重已上传至 HF,Ollama 也已支持
GLM 5.2 已发布,采用 MIT 许可协议在 HuggingFace 上开放权重,可通过 API 和 Ollama 获取,其基准测试结果具有竞争力,仅落后 Opus 4.8 一个点,领先 GPT-5.5 一个点。
@omarsar0: GLM-5.2 在设计方面非常出色(在我看来达到了 Opus 级别)。我也开始看到在长时间运行的任务上取得了很好的结果。如何……
GLM-5.2 是一款具有 Opus 级别设计能力的开放权重模型,它集成了通过强化学习训练的反奖励破解模块,以减轻奖励破解问题并提升长时间运行任务的性能。
@jun_song: GPT-5.6 似乎非常令人失望。并不比 GLM-5.2 好。
一位用户表达了对GPT-5.6的失望,声称它并不比GLM-5.2好。