标签
Maxime Labonne分享说,他们的模型在Hugging Face上成为热门,并且尽管只有1B个活跃参数,但在代理任务上出人意料地强大。
该推文对 Qwen3.6-27B 的思考模式与非思考模式进行了 300+ 问题的基准测试,揭示了这款热门本地模型及其在 Hugging Face 上的衍生生态系统的惊人结果。
一位OpenAI研究员声称,其模型对离散几何中一个Erdős问题的解决是迄今为止AI领域最大的成就,但预测到年底时这一成就将被超越。
GPT-5.5-Cyber 现已面向防御者提供有限预览,提供用于保护关键基础设施的强大模型。