@TeksEdge: 天哪!新开源LLM之王!击败领先开源模型。开始测试以验证基准。Nex-N2-Pr…
摘要
Nex-N2-Pro是NexEcosystem新推出的开源LLM,据报道在基准测试中优于Kimi-K2.6和DeepSeek-V4-Pro等领先模型,具有自适应和连贯思维的特点。
查看缓存全文
缓存时间: 2026/06/08 15:26
🔥卧槽💩!开源大模型新王诞生!吊打一众领先开源模型。赶紧实测验证跑分。
🏆 Nex-N2-Pro 击败 ✅ Kimi-K2.6:86%(13/14) ✅ MiniMax:100%(8/8) ✅ GLM-5.1:100%(13/13) ✅ DeepSeek-V4-Pro:92%(11/12) » Opus 4.7:45%(5/11) » GPT-5.5:30% https://t.co/kgVMLExvGs
Nex(@NexEcosystem): 📢 Nex-N2 来了! 一个智能体模型家族——不仅会思考,还会行动! 编码、搜索、工具调用。全部融合在单一智能体推理循环中。
- 自适应思考,按步自动缩放推理深度。节省约20% token,性能零损失。
- 连贯思考,单
相似文章
@TeksEdge:哇!全新开源计算机使用模型在单个 DGX Spark 上于 LLM 排行榜展现强劲本地性能!这…
H 公司发布了 Holo-3.1-35B-A3B-NVFP4,一款开源计算机使用模型,在单个 DGX Spark 节点上可实现每秒高达 195 个 token 的推理速度,性能超越 Qwen3.5-397B 和 Kimi-K2.5 等更大模型。
@ModelScope2022: Nex-N2 现已开源!来自 Nex AGI 的智能体模型系列,专为编程、工具使用、深度研究和长时...
Nex AGI 发布了 Nex-N2,这是一个开源智能体模型系列,用于编程、工具使用、深度研究和长时工作流,具备最先进的基准测试结果并采用 Apache 2.0 许可证。
@heyshrutimishra:OpenClaw 用户狂喜!终于有开源模型在 SWE-Bench 上超越 Opus 4.6——Kimi K2.6,可连续 12+ 小时自主编码,调用 4,000+ 次工具
开源模型 Kimi K2.6 在 SWE-Bench 上超越 Opus 4.6,支持 12+ 小时自主编码会话,工具调用超 4,000 次。
中国开源的Kimi 2.6和小米MiMo v2.5 Pro双双碾压Claude Opus 4.6
中国团队开源Kimi 2.6与小米MiMo v2.5 Pro,据称在基准测试中全面超越Claude Opus 4.6。
@TeksEdge: 这是本地AI大新闻!一款新的开源计算机使用大语言模型刚刚发布。Holo 3.1 是 H Company 的 () 新本地 c…
H Company 发布了 Holo 3.1,一个开源专为本地部署优化的计算机使用大语言模型,在 AndroidWorld 基准测试中达到 79.3%,超越了更大的模型如 Qwen3.5-397B 和 Kimi-K2.5。