Nex-N2 Pro 名副其实

Reddit r/LocalLLaMA 模型

摘要

作者分享了他们在Nex-N2 Pro上的体验,最初误以为是Rio-3.5,并发现它在编码基准测试中表现异常出色,无幻觉问题,在他们的Mac设备上可与GPT-5.x媲美。

我最初在N2刚发布时对其不屑一顾,因为报告称它在Openrouter上表现很差。所以,Rio-3.5模型事件带来的一个好处是:我对Rio的性能非常好奇,当真相大白——它只是N2 Pro的重新包装——这促使我下载并测试了bartowski的N2 Pro IQ2_S GGUF文件。我的第一次N2测试因内嵌GGUF聊天模板中的bug而失败,但只要切换到Rio的聊天模板,就立刻完美运行。我一直在用它进行编码基准测试,至今印象极其深刻。有一个私人基准测试,我用它来研究llama.cpp源代码,而且它连续通过测试。这是第一个我能在128G Mac上运行的模型(通过bartowski的Rio和N2 GGUF测试),在我尝试的所有次数中100%通过且从未出现幻觉,在此之前只有GPT 5.x有这种一致性。
查看原文

相似文章

@ashwingop: https://x.com/ashwingop/status/2065080505113125105

X AI KOLs Timeline

Sentra的Code Memory系统将GPT-5.5在Terminal-Bench 2.1上的性能提升至88.31%,而成本仅为四分之一,超越了Anthropic受限的Mythos 5模型。该记忆层减少了52%的输入Token,成本降低了72.6%,同时提升了任务成功率。

nex-agi/Nex-N2-Pro

Hugging Face Models Trending

Nex-AGI 发布了 Nex-N2-Pro 与 Nex-N2-mini,这是一个开源的智能体模型,采用“智能体思维”框架,统一了推理、工具使用和环境执行。在智能体编程和长周期任务上展现出具有竞争力的性能。