GLM-5: 从 Vibe Coding 到 Agentic Engineering

Papers with Code Trending 2026/02/17 17:50 论文

摘要

GLM-5 引入了 DSA 以降低成本，采用异步强化学习实现对齐，并增强了编码能力，在基准测试和现实软件工程任务上取得了最先进的性能。

我们推出了 GLM-5，这是一个下一代基础模型，旨在将 vibe coding 范式转变为 agentic engineering。基于其前身的代理、推理和编码（ARC）能力，GLM-5 采用了 DSA，显著降低了训练和推理成本，同时保持了长上下文保真度。为了推进模型对齐和自主性，我们实现了一个新的异步强化学习基础设施，通过将生成与训练解耦，大幅提高了训练后效率。此外，我们提出了新颖的异步代理 RL 算法，进一步提高了 RL 质量，使模型能够更有效地从复杂的、长期交互中学习。通过这些创新，GLM-5 在主要开放基准测试上取得了最先进的性能。最关键的是，GLM-5 在现实世界的编码任务中展示了前所未有的能力，在处理端到端软件工程挑战方面超越了之前的基准。代码、模型和更多信息可在 https://github.com/zai-org/GLM-5 获取。

查看原文

查看缓存全文

缓存时间: 2026/06/17 05:35

论文页面 - GLM-5：从Vibe编码到Agentic工程

来源：https://huggingface.co/papers/2602.15763 发布于2月17日

#1 今日论文 (https://huggingface.co/papers/date/2026-02-18) 作者：

摘要

GLM-5 通过 DSA 降低训练和推理成本，采用异步强化学习改进对齐，并增强编码能力以应对真实世界软件工程挑战，推动了基础模型的发展。

我们提出 GLM-5，这是一款下一代基础模型，旨在将 vibe coding (https://huggingface.co/papers?q=vibe%20coding) 范式向 agentic engineering (https://huggingface.co/papers?q=agentic%20engineering) 转型。GLM-5 在其前身的 agentic、推理和编码（ARC）能力基础上，采用了 DSA (https://huggingface.co/papers?q=DSA) 大幅降低训练和推理成本，同时保持长上下文保真度。为了推进 模型对齐 (https://huggingface.co/papers?q=model%20alignment) 和自主性，我们实现了一种新的 异步强化学习 (https://huggingface.co/papers?q=asynchronous%20reinforcement%20learning) 基础设施，通过将生成与训练解耦，极大提升了 后训练效率 (https://huggingface.co/papers?q=post-training%20efficiency)。此外，我们提出了新颖的异步 agent RL 算法，进一步提高了 RL 质量，使模型能够更有效地从复杂的、长时域交互中学习。通过这些创新，GLM-5 在主流 开放基准 (https://huggingface.co/papers?q=open%20benchmarks) 上达到了最先进性能。最为关键的是，GLM-5 在真实世界编码任务中展现了前所未有的能力，在处理端到端 软件工程 (https://huggingface.co/papers?q=software%20engineering) 挑战方面超越了之前的基线。代码、模型和更多信息详见 https://github.com/zai-org/GLM-5。

查看 arXiv 页面 (https://arxiv.org/abs/2602.15763) 查看 PDF (https://arxiv.org/pdf/2602.15763) GitHub 3.52k (https://github.com/zai-org/GLM-5) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2602.15763)

在您的 agent 中获取这篇论文：

hf papers read 2602.15763

没有最新的 CLI？执行 curl -LsSf https://hf.co/cli/install.sh | bash

引用本论文的模型80个

zai-org/GLM-5 文本生成 • 754B • 更新于4月5日 • 57.4k • 2.1k (https://huggingface.co/zai-org/GLM-5)

zai-org/GLM-5.1 文本生成 • 754B • 更新于5月13日 • 95.1k • 1.8k (https://huggingface.co/zai-org/GLM-5.1)

zai-org/GLM-5.2 文本生成 • 753B • 更新于约12小时前 • 588 (https://huggingface.co/zai-org/GLM-5.2)

unsloth/GLM-5.1-GGUF 文本生成 • 754B • 更新于4月7日 • 111k • 202 (https://huggingface.co/unsloth/GLM-5.1-GGUF)

浏览引用本论文的80个模型 (https://huggingface.co/models?other=arxiv:2602.15763)

引用本论文的数据集2个

zai-org/terminal-bench-2-verified 更新于5月8日 • 6.66k • 76 (https://huggingface.co/datasets/zai-org/terminal-bench-2-verified)

harithoppil/terminal-bench-2-verified 查看器 • 更新于4月28日 • 89 • 653 • 1 (https://huggingface.co/datasets/harithoppil/terminal-bench-2-verified)

引用本论文的 Spaces274个

浏览引用本论文的274个 Spaces (https://huggingface.co/spaces?arxivIds=2602.15763)

包含本论文的收藏集30个

浏览包含本论文的30个收藏集 (https://huggingface.co/collections?paper=2602.15763)

GLM-5: 从 Vibe Coding 到 Agentic Engineering

论文页面 - GLM-5：从Vibe编码到Agentic工程

摘要

引用本论文的模型80个

zai-org/GLM-5 文本生成 • 754B • 更新于4月5日 • 57.4k • 2.1k (https://huggingface.co/zai-org/GLM-5)

zai-org/GLM-5.1 文本生成 • 754B • 更新于5月13日 • 95.1k • 1.8k (https://huggingface.co/zai-org/GLM-5.1)

zai-org/GLM-5.2 文本生成 • 753B • 更新于约12小时前 • 588 (https://huggingface.co/zai-org/GLM-5.2)

unsloth/GLM-5.1-GGUF 文本生成 • 754B • 更新于4月7日 • 111k • 202 (https://huggingface.co/unsloth/GLM-5.1-GGUF)

引用本论文的数据集2个

zai-org/terminal-bench-2-verified 更新于5月8日 • 6.66k • 76 (https://huggingface.co/datasets/zai-org/terminal-bench-2-verified)

harithoppil/terminal-bench-2-verified 查看器 • 更新于4月28日 • 89 • 653 • 1 (https://huggingface.co/datasets/harithoppil/terminal-bench-2-verified)

引用本论文的 Spaces274个

包含本论文的收藏集30个

相似文章

zai-org/GLM-5.1

GLM-5.2 是本地人工智能的一次胜利

GLM 5.1 战略思考，数据中心反抗加剧，当有用的LLM变得无用时，人形机器人开始工作

GLM-5.2（一分钟阅读）

GLM-5.2（6分钟阅读）

提交意见反馈