@atomic_chat_hq:新发布的 @Zai_org GLM-5.2 在物理竞赛中击败了 Kimi K2.7 Code!我们给两个模型相同的三个提示,要求它们……
摘要
Z.ai 发布了 GLM-5.2,这是一款具有开放权重的 AI 模型,在编码和智能体性能方面有所提升,通过在三个任务的物理模拟基准测试中击败 Kimi K2.7 Code 得到证明。
查看缓存全文
缓存时间: 2026/06/17 05:46
新的 @Zai_org GLM-5.2 在物理竞赛中击败了 Kimi K2.7 Code!
我们给两个模型同样的三个提示词,要求它们构建纯 HTML5 物理模拟程序,不依赖任何库,并实现真实物理效果:
- 台球开球
- 弹簧床上的方块
- 高尔顿板
输出结果: GLM-5.2:12,640 个token Kimi K2.7 Code:7,420 个token
GLM 5.2 完美完成了全部三个任务,而且细节更丰富、打磨更精致。台球开球场景中动量守恒,方块在弹簧上弹跳,高尔顿板的小球散落成清晰的正态曲线。而 Kimi 在每个场景中都表现挣扎:它的方块直接穿过弹簧落下,台球开球场景中球的碰撞看起来完全不真实,高尔顿板上的小球相互重叠、堆积在一起,而不是散开
Z.ai (@Zai_org): 推出 GLM-5.2:前沿智能,开放权重
- 编码和智能体任务显著改进
- 强大的长程能力,拥有 1M 上下文窗口
- 两个推理努力级别:GLM-5.2(max)极限推动,而 GLM-5.2(high)则实现强劲平衡
相似文章
有人注意到Kimi模型的行为发生变化了吗?
有用户观察到,Kimi K2.6模型的思维链变得更短更简洁,提升了Kimi Code中的编码性能,并希望即将发布的GLM 5.2和Fable 5能够继续通过开源进行竞争。
Kimi K2.7 Code 务实胜过炫技
Kimi 发布了 K2.7 Code,这是一款专注于编程的 AI 模型,其基准测试成绩提升,且思考令牌使用量降低 30%。它更强调在长代码循环和智能体工具集成中的实际性能,而非炫目的分数。
zai-org/GLM-5.1
GLM-5.1 是一款新一代旗舰AI模型,针对代理工程进行了优化,编码能力显著增强,在SWE-Bench Pro上达到了最先进性能,并通过扩展迭代和工具使用展示了卓越的长周期任务处理能力。
zai-org/GLM-5.2 来了!
Z.AI 发布了 GLM-5.2,这是一款新的旗舰模型,拥有稳定的 1M token 上下文窗口,通过灵活的思考努力增强了编码能力,并通过 IndexShare 改进了架构。该模型在 MIT 开源许可证下发布。
@omarsar0:我们正在迎来开放权重模型极其激动人心的时代,Kimi K2.6 如今已堪称顶级智能体模型。我通过 ……
Kimi K2.6 作为开放权重模型发布,具备强大的智能体能力,可通过 FireworksAI 的高速推理 API 使用。