@atomic_chat_hq:新发布的 @Zai_org GLM-5.2 在物理竞赛中击败了 Kimi K2.7 Code!我们给两个模型相同的三个提示,要求它们……

X AI KOLs Following 模型

摘要

Z.ai 发布了 GLM-5.2,这是一款具有开放权重的 AI 模型,在编码和智能体性能方面有所提升,通过在三个任务的物理模拟基准测试中击败 Kimi K2.7 Code 得到证明。

新的 @Zai_org GLM-5.2 在物理竞赛中击败了 Kimi K2.7 Code! 我们给两个模型相同的三个提示,要求它们构建自包含的 HTML5 模拟,具有真实物理效果且不使用任何库: 1. 台球开球 2. 弹簧床上的方块 3. 高尔顿板 输出结果: GLM-5.2:12,640 个令牌 Kimi K2.7 Code:7,420 个令牌 GLM 5.2 完美完成了所有三个任务,而且细节更丰富、更精致。开球符合动量守恒,方块从弹簧上弹起,高尔顿板上的珠子散开形成清晰的正态曲线。Kimi 在每个场景中都表现不佳:其方块直直地穿过弹簧,开球时球的碰撞看起来不真实、完全不对,在高尔顿板上珠子互相重叠堆积,而不是散开。
查看原文
查看缓存全文

缓存时间: 2026/06/17 05:46

新的 @Zai_org GLM-5.2 在物理竞赛中击败了 Kimi K2.7 Code!

我们给两个模型同样的三个提示词,要求它们构建纯 HTML5 物理模拟程序,不依赖任何库,并实现真实物理效果:

  1. 台球开球
  2. 弹簧床上的方块
  3. 高尔顿板

输出结果: GLM-5.2:12,640 个token Kimi K2.7 Code:7,420 个token

GLM 5.2 完美完成了全部三个任务,而且细节更丰富、打磨更精致。台球开球场景中动量守恒,方块在弹簧上弹跳,高尔顿板的小球散落成清晰的正态曲线。而 Kimi 在每个场景中都表现挣扎:它的方块直接穿过弹簧落下,台球开球场景中球的碰撞看起来完全不真实,高尔顿板上的小球相互重叠、堆积在一起,而不是散开

Z.ai (@Zai_org): 推出 GLM-5.2:前沿智能,开放权重

  • 编码和智能体任务显著改进
  • 强大的长程能力,拥有 1M 上下文窗口
  • 两个推理努力级别:GLM-5.2(max)极限推动,而 GLM-5.2(high)则实现强劲平衡

相似文章

Kimi K2.7 Code 务实胜过炫技

Reddit r/AI_Agents

Kimi 发布了 K2.7 Code,这是一款专注于编程的 AI 模型,其基准测试成绩提升,且思考令牌使用量降低 30%。它更强调在长代码循环和智能体工具集成中的实际性能,而非炫目的分数。

zai-org/GLM-5.1

Hugging Face Models Trending

GLM-5.1 是一款新一代旗舰AI模型,针对代理工程进行了优化,编码能力显著增强,在SWE-Bench Pro上达到了最先进性能,并通过扩展迭代和工具使用展示了卓越的长周期任务处理能力。

zai-org/GLM-5.2 来了!

Reddit r/LocalLLaMA

Z.AI 发布了 GLM-5.2,这是一款新的旗舰模型,拥有稳定的 1M token 上下文窗口,通过灵活的思考努力增强了编码能力,并通过 IndexShare 改进了架构。该模型在 MIT 开源许可证下发布。