@heyshrutimishra:OpenClaw 用户狂喜!终于有开源模型在 SWE-Bench 上超越 Opus 4.6——Kimi K2.6,可连续 12+ 小时自主编码,调用 4,000+ 次工具

X AI KOLs Following 模型

摘要

开源模型 Kimi K2.6 在 SWE-Bench 上超越 Opus 4.6,支持 12+ 小时自主编码会话,工具调用超 4,000 次。

OpenClaw 用户狂喜!终于有开源模型在 SWE-Bench 上超越 Opus 4.6——它就是 Kimi K2.6,可连续运行 12+ 小时自主编码,一口气调用 4,000+ 次工具。这条推文值得收藏。
查看原文
查看缓存全文

缓存时间: 2026/04/23 07:49

OpenClaw 用户要狂喜了
终于有一个开源模型在 SWE-Bench 上干掉了 Opus 4.6
它就是 Kimi K2.6,能跑 12+ 小时的自主编程马拉松,调用 4,000+ 次工具
这条推文值得你收藏

相似文章

Kimi K2.6 是真正的 Opus 4.7 替代品

Reddit r/LocalLLaMA

经过实测并结合部分客户反馈,这是目前首款让我有底气向客户推荐用于替代 Opus 4.7 的模型。虽然它在单项能力上并未明显超越 Opus 4.7,但能以可接受的质量完成 Opus 约 85% 的任务,同时还配备了视觉理解和强大的浏览器操作能力。我最近一直在逐步将部分个人工作流迁移至 Kimi K2.6,表现令人惊喜,尤其在长周期任务中尤为出色。尽管该模型体积庞大,