我不信这个 27B 模型能碾压 Opus 4.5!谁来用真实 Agent 工作流验证一下?

Reddit r/LocalLLaMA 模型

摘要

一个 27B 参数的模型据称在基准测试中击败 Opus 4.5,引发社区质疑,大家呼吁用真实 Agent 工作流验证。

暂无内容
查看原文

相似文章