标签
Kog 开源了 Laneformer 2B 模型,这是一个 23 亿参数、经过指令调优的编码模型,专为高速解码设计。通过从架构阶段优先考虑延迟,实现了每秒超过 3000 个 token 的生成速度。
Jackrong 发布了 Qwopus3.6-27B-Coder-Compat-MTP-GGUF,这是 Qwopus3.6-27B-Coder 模型的 GGUF 量化版本,并扩展了聊天模板,以提升与工具使用运行时及 OpenAI 兼容的代理框架的互操作性。
GLM 5.2 是一个前沿的开源编程模型,在编程任务上的表现接近 Claude Opus,具备出色的工具调用、规划和本地部署能力,且完全免费。
本文讨论了JetBrains如何悄然为开发者构建AI生态系统,包括AI Assistant、自研编码模型Mellum以及开源AI项目,这可能使其成为主要的AI赢家。
智谱发布了GLM 5.2模型,专注于Coding能力,开源且支持1M上下文。实测显示其在大型工程和代码任务上接近Claude Opus 4.8水平,但缺乏多模态能力,受限于算力导致速度较慢。文章也提及Anthropic因美国商务部要求关停Fable 5和Mythos 5的事件,突显了AI开源与封闭的对比。
智谱AI发布GLM-5.2,这是其能力最强的开源模型,支持100万上下文窗口,定位为复杂智能体应用和编码模型的基础,即日起向GLM Coding Plan用户提供,API将于下周上线。
Kimi 发布并开源了 Kimi 2.7 Code,这是一款性能提升、减少推理 token 数量并具备长时编码能力的编码模型。
Cohere正式发布North Mini Code编程模型,权重可在Hugging Face上获取,并支持vLLM和MLX部署。
Cohere 发布了其首个开源编码模型 North Mini Code Small,专为高效的代理型性能和社区反馈而设计。
Cohere发布了一款早期访问编码模型BLS-Mini-Code-1.0,这是一个30B参数的模型,可在Hugging Face上进行测试。
一种针对AMD MI300X GPU上LLM解码的单内核方法,每个请求可达3300输出tokens/秒,无需推测解码或量化,利用映射到芯片拓扑结构的内存访问模式。
阿里巴巴发布了通义千问 3.7 Max,一款专为智能体时代设计的旗舰编码模型。该模型在长周期自主执行、前端生成和3D场景构建上表现突出,多项基准测试中与顶尖闭源模型持平甚至超越,是接近前沿的中国模型。
用户分享了使用 Qwen 3.6 27B 进行本地编码任务的经验,并寻求适合拥有 224GB 显存系统的更大模型(100B 以上)的推荐。
OpenAI 发布 GPT-5.2-Codex,这是一款先进的智能编程模型,针对复杂软件工程任务进行了优化,具备改进的长周期能力、Windows 支持以及网络安全功能。此次发布通过系统卡提供了全面的安全文档,概述了模型和产品层面的缓解措施。
OpenAI 发布了 GPT-5.1-Codex-Max,这是一款前沿的智能体编码模型,针对软件工程任务进行了训练,通过压缩技术支持原生多上下文窗口,能够在单个任务中处理数百万个令牌。系统卡详细说明了在网络安全、生物学和 AI 自我改进等领域的全面安全措施和准备情况框架评估。
OpenAI 推出 GPT-5.1-Codex-Max,这是一款新的智能代理编码模型,具有改进的推理能力、token 效率,以及通过“压缩”机制在数百万个 token 上保持连贯工作的能力。该模型更快速、更智能,可以持续运行数小时甚至数天的长时间任务,代表了 AI 辅助软件工程的重大进步。