GLM-5: 从 Vibe Coding 到 Agentic Engineering

Papers with Code Trending 论文

摘要

GLM-5 引入了 DSA 以降低成本,采用异步强化学习实现对齐,并增强了编码能力,在基准测试和现实软件工程任务上取得了最先进的性能。

我们推出了 GLM-5,这是一个下一代基础模型,旨在将 vibe coding 范式转变为 agentic engineering。基于其前身的代理、推理和编码(ARC)能力,GLM-5 采用了 DSA,显著降低了训练和推理成本,同时保持了长上下文保真度。为了推进模型对齐和自主性,我们实现了一个新的异步强化学习基础设施,通过将生成与训练解耦,大幅提高了训练后效率。此外,我们提出了新颖的异步代理 RL 算法,进一步提高了 RL 质量,使模型能够更有效地从复杂的、长期交互中学习。通过这些创新,GLM-5 在主要开放基准测试上取得了最先进的性能。最关键的是,GLM-5 在现实世界的编码任务中展示了前所未有的能力,在处理端到端软件工程挑战方面超越了之前的基准。代码、模型和更多信息可在 https://github.com/zai-org/GLM-5 获取。
查看原文
查看缓存全文

缓存时间: 2026/06/17 05:35

论文页面 - GLM-5:从Vibe编码到Agentic工程

来源:https://huggingface.co/papers/2602.15763 发布于2月17日

#1 今日论文 (https://huggingface.co/papers/date/2026-02-18) 作者:

,

,

,

,

,

,

,

,

,

,

,

摘要

GLM-5 通过 DSA 降低训练和推理成本,采用异步强化学习改进对齐,并增强编码能力以应对真实世界软件工程挑战,推动了基础模型的发展。

我们提出 GLM-5,这是一款下一代基础模型,旨在将 vibe coding (https://huggingface.co/papers?q=vibe%20coding) 范式向 agentic engineering (https://huggingface.co/papers?q=agentic%20engineering) 转型。GLM-5 在其前身的 agentic、推理和编码(ARC)能力基础上,采用了 DSA (https://huggingface.co/papers?q=DSA) 大幅降低训练和推理成本,同时保持长上下文保真度。为了推进 模型对齐 (https://huggingface.co/papers?q=model%20alignment) 和自主性,我们实现了一种新的 异步强化学习 (https://huggingface.co/papers?q=asynchronous%20reinforcement%20learning) 基础设施,通过将生成与训练解耦,极大提升了 后训练效率 (https://huggingface.co/papers?q=post-training%20efficiency)。此外,我们提出了新颖的异步 agent RL 算法,进一步提高了 RL 质量,使模型能够更有效地从复杂的、长时域交互中学习。通过这些创新,GLM-5 在主流 开放基准 (https://huggingface.co/papers?q=open%20benchmarks) 上达到了最先进性能。最为关键的是,GLM-5 在真实世界编码任务中展现了前所未有的能力,在处理端到端 软件工程 (https://huggingface.co/papers?q=software%20engineering) 挑战方面超越了之前的基线。代码、模型和更多信息详见 https://github.com/zai-org/GLM-5。

查看 arXiv 页面 (https://arxiv.org/abs/2602.15763) 查看 PDF (https://arxiv.org/pdf/2602.15763) GitHub 3.52k (https://github.com/zai-org/GLM-5) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2602.15763)

在您的 agent 中获取这篇论文:

hf papers read 2602.15763

没有最新的 CLI?执行 curl -LsSf https://hf.co/cli/install.sh | bash

引用本论文的模型80个

zai-org/GLM-5 文本生成 • 754B • 更新于4月5日 • 57.4k • 2.1k (https://huggingface.co/zai-org/GLM-5)

zai-org/GLM-5.1 文本生成 • 754B • 更新于5月13日 • 95.1k • 1.8k (https://huggingface.co/zai-org/GLM-5.1)

zai-org/GLM-5.2 文本生成 • 753B • 更新于约12小时前 • 588 (https://huggingface.co/zai-org/GLM-5.2)

unsloth/GLM-5.1-GGUF 文本生成 • 754B • 更新于4月7日 • 111k • 202 (https://huggingface.co/unsloth/GLM-5.1-GGUF)

浏览引用本论文的80个模型 (https://huggingface.co/models?other=arxiv:2602.15763)

引用本论文的数据集2个

zai-org/terminal-bench-2-verified 更新于5月8日 • 6.66k • 76 (https://huggingface.co/datasets/zai-org/terminal-bench-2-verified)

harithoppil/terminal-bench-2-verified 查看器 • 更新于4月28日 • 89 • 653 • 1 (https://huggingface.co/datasets/harithoppil/terminal-bench-2-verified)

引用本论文的 Spaces274个

浏览引用本论文的274个 Spaces (https://huggingface.co/spaces?arxivIds=2602.15763)

包含本论文的收藏集30个

浏览包含本论文的30个收藏集 (https://huggingface.co/collections?paper=2602.15763)

相似文章

zai-org/GLM-5.1

Hugging Face Models Trending

GLM-5.1 是一款新一代旗舰AI模型,针对代理工程进行了优化,编码能力显著增强,在SWE-Bench Pro上达到了最先进性能,并通过扩展迭代和工具使用展示了卓越的长周期任务处理能力。

GLM-5.2 是本地人工智能的一次胜利

Reddit r/LocalLLaMA

GLM-5.2 是一款拥有 753B 参数、采用 MIT 许可证的开源模型,具备前沿级别的编码能力和超大的上下文窗口。其蒸馏潜力有望为本地 AI 设置带来显著改进。

GLM-5.2(一分钟阅读)

TLDR AI

GLM-5.2 是新一代旗舰级编程模型,支持 100 万上下文并增强推理能力,现已面向 GLM 编程计划用户开放,将于下周以 MIT 许可证开源。

GLM-5.2(6分钟阅读)

TLDR AI

Z.ai 推出了 GLM-5.2,拥有100万token的上下文窗口、新的推理控制功能,并支持长期编码任务。该模型现已面向 Coding Plan 用户提供,API 访问、聊天机器人支持以及 MIT 许可的开放权重将于下周推出。