标签
中国发布了一个名为Ornith的开源编程AI大模型,35B版本击败了Qwen3.6,397B版本基准测试接近Claude Opus 3.7。
一个基于Claude Code构建的自定义AI代理管线将软件开发成本降低了60-70%,并使大多数工单能在15分钟内处理完成,但在生产部署前仍需人工审查。
微软推出了MAI Code 1 Flash,这是一款全新的内部编程AI模型,现已在GitHub Copilot的所有层级上免费提供,具有更高的效率和256K上下文窗口。
讨论在每月10-20美元价位的最佳AI编程助手,指出Claude和ChatGPT现在比早期版本更受限且降级,Gemini则是当前的竞争者。
GrandCode是一个多智能体强化学习系统,在竞技编程中达到了特级大师水平,通过新颖的Agentic GRPO方法,在实时Codeforces竞赛中持续击败所有人类参赛者。
Mark Zuckerberg revealed in a leaked internal meeting that Meta plans to train AI models by observing its top engineers' work habits to gain a competitive edge in AI coding and computer use, while promising no employee monitoring.
泄露音频显示,Meta正在利用工程师的工作轨迹,通过行为克隆来训练编程AI,同时裁减数千个工作岗位。
文章讨论Google内部战略调整,面对OpenAI和Anthropic的竞争,Google在Gemini 3上取得效果,但意识到大模型决战在于写代码能力,体现公司追赶的急迫感。
小米推出MiMo-V2.5-Pro,在SWE-Bench Pro得分73.7(接近Claude Opus 4.6的77.1),token成本比美国前沿模型低40-60%。
SpaceXAI 与 Cursor 联手构建先进的编程与知识工作 AI,结合 Cursor 的开发者触达能力与 SpaceX 百万 H100 等效 Colossus 超算。