GLM-5.2 可能是目前最强大的纯文本开放权重大语言模型
摘要
中国AI实验室Z.ai发布了GLM-5.2,这是一个拥有7530亿参数的开放权重大语言模型,支持100万token的上下文窗口,采用MIT许可证。该模型在Artificial Analysis Intelligence Index上获得最高分,并在Code Arena WebDev排行榜上排名第二。
暂无内容
查看缓存全文
缓存时间: 2026/06/18 03:54
# GLM-5.2 很可能是目前最强大的纯文本开放权重 LLM
来源:https://simonwillison.net/2026/Jun/17/glm-52/
2026年6月17日
中国 AI 实验室 Z\.ai (https://z.ai/) 于6月13日向编码计划订阅者 (https://x.com/Zai_org/status/2065704919299235870) 发布了 GLM\-5\.2,随后于昨天(6月16日)以 MIT 许可证发布了完整开放权重。其规模与之前的 GLM\-5 和 GLM\-5\.1 版本相近,是一个 753B 参数、1\.51TB (https://huggingface.co/zai-org/GLM-5.2) 的庞然大物——具有 40 个激活参数(混合专家模型)。GLM\-5\.2 是一个纯文本输入模型——Z\.ai 有独立的视觉系列,最新代表是 GLM\-5V\-Turbo (https://x.com/Zai_org/status/2039371126984360085),但那个模型没有开放权重。GLM\-5\.2 拥有 100 万个 Tokens 的上下文窗口,相比 GLM\-5\.1 的 20 万个 Tokens 有所提升。
关于这个模型的讨论非常热烈。
Artificial Analysis 运营着最受尊敬的独立基准测试之一:GLM\-5\.2 在 Artificial Analysis 智能指数 (https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index) 上成为新的领先开放权重模型。
> **GLM\-5\.2 是 Intelligence Index v4\.1 上领先的开放权重模型。** 得分为 51,领先于 MiniMax\-M3(44)、DeepSeek V4 Pro(max,44)和 Kimi K2\.6(43)。
但他们也发现该模型相当消耗 Tokens:
> **GLM\-5\.2 在每项任务中使用的输出 Tokens 比其他领先的开放权重模型更多:** 该模型在每项 Intelligence Index 任务中使用 43k 个输出 Tokens,高于 GLM\-5\.1(26k)以及 MiniMax\-M3(24k)、Kimi K2\.6(35k)和 DeepSeek V4 Pro(max,37k)。
该模型现在也在 Code Arena WebDev 排行榜 (https://arena.ai/leaderboard/code/webdev) 上排名第二,仅次于 Claude Fable 5。该排行榜衡量的是“前端 Web 开发任务,包括代理式编码工作流”。看到它在没有图像输入的情况下排名如此之高,我印象深刻——我之前错误地认为图像输入是构建真正出色的前端编码模型的关键部分。
我一直在通过 OpenRouter (https://openrouter.ai/z-ai/glm-5.2) 试用它,该平台有 9 个不同的提供商,几乎所有提供商都收取输入 $1.40/百万 Tokens 和输出 $4.40/百万 Tokens 的费用。相比之下,GPT\-5.5 是 $5/$30,Claude Opus 4.5\-4.8 是 $5/$25。
#### 出色的鹈鹕,令人失望的负鼠
GLM\-5\.1 给了我一个我最喜欢的鹈鹕 (https://simonwillison.net/2026/Apr/7/glm-51/) 和我有史以来最喜欢的负鼠 (https://simonwillison.net/2026/Apr/7/glm-51/#opossum)(针对提示词“Generate an SVG of a NORTH VIRGINIA OPOSSUM ON AN E\-SCOOTER”)。有趣的是,在这两个例子中,模型都选择返回包装在 HTML 文档中的 SVG,并使用 CSS 添加了额外的动画。
让我们试试 GLM\-5\.2。对于“Generate an SVG of a pelican riding a bicycle”,我得到了这个 (https://gist.github.com/simonw/5c989366b796f054d9ae1ad7e38dc03a):
它是一辆非常好的自行车——所有正确的部件,轮子上的辐条,轮子和踏板在旋转——以及一只非常好的鹈鹕,红色围巾,好喙,上下摆动。但脚没有踩在踏板上。
它是一个自包含的完整动画 SVG,而且动画没有坏!我经常看到眼睛掉下来,或者轮子独立于自行车旋转,但这里一切都运行得很好。它也是一个非常好的鹈鹕矢量插图。非常令人印象深刻。
遗憾的是,NORTH VIRGINIA OPOSSUM ON AN E\-SCOOTER 的效果就差得远 (https://gist.github.com/simonw/5913b56e3d0ba9a2ece75ce1471f87bb):
奇怪的背景网格线,滑板车是绿色的,不太像滑板车,负鼠戴着红色安全帽,有一条毛茸茸的尾巴,但几乎认不出是负鼠。它就是糟糕。
这比 GLM\-5\.1 差远了!提醒一下,那只负鼠长这样:
这太棒了。它很暗,负鼠明显是负鼠,它骑着电动滑板车,可爱的动画,尾巴上下摆动,字幕写着 NORTH VIRGINIA OPOSSUM, CRUISING THE COMMONWEALTH SINCE DUSK —— 唯一的瑕疵是它偶尔会眨眼,眼睛从脸上掉下来
5\.2 甚至都没有*尝试*去制作动画。
相似文章
GLM-5.2 是 Artificial Analysis 上新的领先开源权重模型
智谱AI的GLM-5.2已成为Artificial Analysis Intelligence Index上新的领先开源权重模型,得分为51,超越了MiniMax-M3和DeepSeek V4 Pro等竞争对手。该模型拥有744B总参数、40B活跃参数、MIT许可证和1M上下文窗口。
GLM-5.2 刚发布开放权重,在编程方面已经异常强大
GLM-5.2 已以 MIT 许可证发布开放权重,拥有 100 万上下文窗口和两种推理努力模式。早期基准测试显示它在编程任务中表现出色,值得在基准截图之外进行测试。
GLM-5.2 是本地人工智能的一次胜利
GLM-5.2 是一款拥有 753B 参数、采用 MIT 许可证的开源模型,具备前沿级别的编码能力和超大的上下文窗口。其蒸馏潜力有望为本地 AI 设置带来显著改进。
GLM-5.2: 专为长程任务打造
Z.AI推出GLM-5.2,这是一款专为长程任务设计的旗舰模型,拥有稳定的100万token上下文、改进的编码能力以及MIT开源许可证,在与Opus 4.8和GPT-5.5等领先模型的对比中展现了竞争力。
GLM 5.2 是一款猛兽级模型
GLM 5.2 是一款强大的新AI模型发布,可能来自智谱AI,其性能被形容为猛兽。