@aisearchio: GLM 5.2 持续让我印象深刻。这是它在 Vending Bench 上的结果，该基准衡量 AI 在长时间运营业务方面的表…

X AI KOLs Following 2026/06/20 23:28 模型

glm-5-2 benchmark vending-bench ai-model cost-efficiency evaluation

摘要

GLM 5.2 在 Vending Bench 业务模拟基准测试中排名第二，同时成本不到 Opus 的一半，以更低的成本展现了强劲性能。

GLM 5.2 持续让我印象深刻。这是它在 Vending Bench 上的结果，该基准衡量 AI 在长时间运营业务方面的表现。 GLM 5.2 排名第二，而成本不到 Opus 的一半。 https://t.co/IXOgXyQMJM

查看原文

查看缓存全文

缓存时间: 2026/06/22 23:42

GLM 5.2 持续给我留下深刻印象。

这是它在 Vending Bench 上的表现，该基准测试衡量 AI 在长期经营业务方面的能力。

GLM 5.2 名列第二，而成本不到 Opus 的一半。https://t.co/IXOgXyQMJM

相似文章

Hacker News Top

GLM 5.2 是 Z.ai 推出的全新开放权重模型，与 Claude Opus 在 3D 游戏编码任务中进行了对比。Opus 性能更快更清晰，但 GLM 5.2 在成本和易用性上具有显著优势。

X AI KOLs Following

GLM-5.2 是一款具有 Opus 级别设计能力的开放权重模型，它集成了通过强化学习训练的反奖励破解模块，以减轻奖励破解问题并提升长时间运行任务的性能。

Reddit r/AI_Agents

GLM 5.2 是一款强大的新AI模型发布，可能来自智谱AI，其性能被形容为猛兽。

X AI KOLs Timeline

GLM 5.2 是一款与顶级闭源模型相媲美的开放权重 AI 模型，现已发布，并在两台 Mac Studio（M3 Ultra）上通过 MLX 运行。

X AI KOLs Following

Sentdex报告称，Zai的GLM 5.2是首个能够在许多任务上取代GPT-5.5和Opus 4.8的开源模型，具有强大的编码和代理性能，以及1M上下文窗口。