@heyshrutimishra：OpenClaw 用户狂喜！终于有开源模型在 SWE-Bench 上超越 Opus 4.6——Kimi K2.6，可连续 12+ 小时自主编码，调用 4,000+ 次工具

X AI KOLs Following 2026/04/22 06:42 模型

摘要

开源模型 Kimi K2.6 在 SWE-Bench 上超越 Opus 4.6，支持 12+ 小时自主编码会话，工具调用超 4,000 次。

OpenClaw 用户狂喜！终于有开源模型在 SWE-Bench 上超越 Opus 4.6——它就是 Kimi K2.6，可连续运行 12+ 小时自主编码，一口气调用 4,000+ 次工具。这条推文值得收藏。

查看原文

查看缓存全文

缓存时间: 2026/04/23 07:49

OpenClaw 用户要狂喜了
终于有一个开源模型在 SWE-Bench 上干掉了 Opus 4.6
它就是 Kimi K2.6，能跑 12+ 小时的自主编程马拉松，调用 4,000+ 次工具
这条推文值得你收藏

相似文章

@CodeByPoonam：Claude Opus 4.7 对比 Kimi K2.6，完全不在一个档次。三个月前没人相信开源能击败 Claude，而今天它做到了…

X AI KOLs Timeline

该推文声称开源模型 Kimi K2.6 已超越 Claude Opus 4.7，标志着开源 AI 在短短三个月内取得重大突破。文中附上了完整指南与提示词的链接，以便验证对比结果。

中国开源的Kimi 2.6和小米MiMo v2.5 Pro双双碾压Claude Opus 4.6

Reddit r/singularity

中国团队开源Kimi 2.6与小米MiMo v2.5 Pro，据称在基准测试中全面超越Claude Opus 4.6。

Kimi K2.6 是真正的 Opus 4.7 替代品

Reddit r/LocalLLaMA

经过实测并结合部分客户反馈，这是目前首款让我有底气向客户推荐用于替代 Opus 4.7 的模型。虽然它在单项能力上并未明显超越 Opus 4.7，但能以可接受的质量完成 Opus 约 85% 的任务，同时还配备了视觉理解和强大的浏览器操作能力。我最近一直在逐步将部分个人工作流迁移至 Kimi K2.6，表现令人惊喜，尤其在长周期任务中尤为出色。尽管该模型体积庞大，

@akshay_pachaar：Kimi K2.6 为开源模型树立了新标杆。Moonshot 昨日发布，首个开放权重模型在关键的智能体基准上硬刚 Claude Opus 4.6

X AI KOLs Following

Moonshot 的开放权重 Kimi K2.6 在核心智能体基准上与 Claude Opus 4.6 打成平手，而成本仅为后者的一小部分。

@kirillk_web3：你明白 Kimi K2.6 刚刚发布意味着什么吗？开源。免费。1 万亿参数。这才是大家没在谈论的关键……