GLM-5: 从 Vibe Coding 到 Agentic Engineering
摘要
GLM-5 引入了 DSA 以降低成本,采用异步强化学习实现对齐,并增强了编码能力,在基准测试和现实软件工程任务上取得了最先进的性能。
查看缓存全文
缓存时间: 2026/06/17 05:35
论文页面 - GLM-5:从Vibe编码到Agentic工程
来源:https://huggingface.co/papers/2602.15763 发布于2月17日
#1 今日论文 (https://huggingface.co/papers/date/2026-02-18) 作者:
,
,
,
,
,
,
,
,
,
,
,
摘要
GLM-5 通过 DSA 降低训练和推理成本,采用异步强化学习改进对齐,并增强编码能力以应对真实世界软件工程挑战,推动了基础模型的发展。
我们提出 GLM-5,这是一款下一代基础模型,旨在将 vibe coding (https://huggingface.co/papers?q=vibe%20coding) 范式向 agentic engineering (https://huggingface.co/papers?q=agentic%20engineering) 转型。GLM-5 在其前身的 agentic、推理和编码(ARC)能力基础上,采用了 DSA (https://huggingface.co/papers?q=DSA) 大幅降低训练和推理成本,同时保持长上下文保真度。为了推进 模型对齐 (https://huggingface.co/papers?q=model%20alignment) 和自主性,我们实现了一种新的 异步强化学习 (https://huggingface.co/papers?q=asynchronous%20reinforcement%20learning) 基础设施,通过将生成与训练解耦,极大提升了 后训练效率 (https://huggingface.co/papers?q=post-training%20efficiency)。此外,我们提出了新颖的异步 agent RL 算法,进一步提高了 RL 质量,使模型能够更有效地从复杂的、长时域交互中学习。通过这些创新,GLM-5 在主流 开放基准 (https://huggingface.co/papers?q=open%20benchmarks) 上达到了最先进性能。最为关键的是,GLM-5 在真实世界编码任务中展现了前所未有的能力,在处理端到端 软件工程 (https://huggingface.co/papers?q=software%20engineering) 挑战方面超越了之前的基线。代码、模型和更多信息详见 https://github.com/zai-org/GLM-5。
查看 arXiv 页面 (https://arxiv.org/abs/2602.15763) 查看 PDF (https://arxiv.org/pdf/2602.15763) GitHub 3.52k (https://github.com/zai-org/GLM-5) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2602.15763)
在您的 agent 中获取这篇论文:
hf papers read 2602.15763
没有最新的 CLI?执行 curl -LsSf https://hf.co/cli/install.sh | bash
引用本论文的模型80个
zai-org/GLM-5 文本生成 • 754B • 更新于4月5日 • 57.4k • 2.1k (https://huggingface.co/zai-org/GLM-5)
zai-org/GLM-5.1 文本生成 • 754B • 更新于5月13日 • 95.1k • 1.8k (https://huggingface.co/zai-org/GLM-5.1)
zai-org/GLM-5.2 文本生成 • 753B • 更新于约12小时前 • 588 (https://huggingface.co/zai-org/GLM-5.2)
unsloth/GLM-5.1-GGUF 文本生成 • 754B • 更新于4月7日 • 111k • 202 (https://huggingface.co/unsloth/GLM-5.1-GGUF)
浏览引用本论文的80个模型 (https://huggingface.co/models?other=arxiv:2602.15763)
引用本论文的数据集2个
zai-org/terminal-bench-2-verified 更新于5月8日 • 6.66k • 76 (https://huggingface.co/datasets/zai-org/terminal-bench-2-verified)
harithoppil/terminal-bench-2-verified 查看器 • 更新于4月28日 • 89 • 653 • 1 (https://huggingface.co/datasets/harithoppil/terminal-bench-2-verified)
引用本论文的 Spaces274个
浏览引用本论文的274个 Spaces (https://huggingface.co/spaces?arxivIds=2602.15763)
包含本论文的收藏集30个
浏览包含本论文的30个收藏集 (https://huggingface.co/collections?paper=2602.15763)
相似文章
zai-org/GLM-5.1
GLM-5.1 是一款新一代旗舰AI模型,针对代理工程进行了优化,编码能力显著增强,在SWE-Bench Pro上达到了最先进性能,并通过扩展迭代和工具使用展示了卓越的长周期任务处理能力。
GLM-5.2 是本地人工智能的一次胜利
GLM-5.2 是一款拥有 753B 参数、采用 MIT 许可证的开源模型,具备前沿级别的编码能力和超大的上下文窗口。其蒸馏潜力有望为本地 AI 设置带来显著改进。
GLM 5.1 战略思考,数据中心反抗加剧,当有用的LLM变得无用时,人形机器人开始工作
Andrew Ng 讨论了编码代理如何以不同速度加速不同类型的软件工作,其中前端开发受益最大,研究受益最小。
GLM-5.2(一分钟阅读)
GLM-5.2 是新一代旗舰级编程模型,支持 100 万上下文并增强推理能力,现已面向 GLM 编程计划用户开放,将于下周以 MIT 许可证开源。
GLM-5.2(6分钟阅读)
Z.ai 推出了 GLM-5.2,拥有100万token的上下文窗口、新的推理控制功能,并支持长期编码任务。该模型现已面向 Coding Plan 用户提供,API 访问、聊天机器人支持以及 MIT 许可的开放权重将于下周推出。