标签
MiniMax发布了M3,一个开放权重模型,结合了前沿编码、1M上下文和原生多模态能力,性能与Opus相当,但成本仅为其一小部分。
NVIDIA发布Nemotron-3-Ultra-550B-A55B,这是一个5500亿参数(550亿活跃参数)的前沿大语言模型,采用混合LatentMoE架构,结合Mamba-2、MoE和注意力层,支持高达100万令牌的上下文长度和可配置的推理模式。它支持11种语言,并针对复杂的智能体工作流、长上下文分析和高精度推理进行了优化。
谷歌的Gemma 4 12B引入了无需编码器的多模态架构,可与更大模型竞争,但基准测试对比显示它在大多数任务上落后于Qwen 2.5 9B。文章还涵盖了相关进展,包括开放权重模型的安全风险、Uber对Claude Code的支出上限以及NeurIPS对未校准AI检测器的误用。
一款开放权重的8B参数语音模型仅需110毫秒延迟,比人类平均对话延迟200-250毫秒更快。它可以在本地运行,并通过GitHub仓库免费获取。
谷歌在Hugging Face上发布了Magenta RealTime 2,这是一个开源权重模型,可在设备上实现实时连续音乐生成,延迟约200毫秒,并可通过文本、音频或MIDI进行控制。
NVIDIA 发布 Nemotron-3-Ultra,一个拥有 5500 亿参数的开源权重模型,采用结合 Mamba-2、MoE 和注意力的混合架构,支持高达 100 万 token 的上下文长度和可配置的推理模式。
微软在 Build 2026 上宣布了两款新的设备端 AI 模型:Aion 1.0 Instruct(一款开放权重的小型语言模型)和 Aion 1.0 Plan(一款 140 亿参数的推理与工具调用模型,适用于本地智能体工作流)。
NVIDIA 发布 Cosmos 3(混合 Transformer 模型,参数最高达 64B)、Nemotron 3 Ultra(550B-A55B 大语言模型),并在 Computex 2026 上预览了 RTX Spark 个人超级芯片,在多个开源模型排行榜上达到 SOTA。
对DeepSWE基准数据的分析揭示了模型之间令人惊讶的成本和性能差异,GPT 5.5在能力和成本效率方面领先,而开放权重模型每次通过的成本可能很高。
MiniMax 宣布推出 MiniMax-M3,这是一款结合前沿编程和代理能力的开源权重模型,采用稀疏注意力机制扩展至 1M 上下文,计划于下周在 HuggingFace 上线。
MiniMax发布了MiniMax M3,这是首个开源权重AI模型,集成了编码和智能体任务的前沿能力,通过稀疏注意力扩展到100万上下文,取得了强劲的基准分数。
MiniMax 推出了 M3,这是首个结合编程、智能体与多模态能力的开源权重模型,通过稀疏注意力机制支持高达 100 万 token 的上下文。
本文探讨了开源权重模型在性能上可能超越基于云的模型的影响,同时指出安全护栏正在改进。
PrismML 发布 Bonsai Image 4B,这是一系列紧凑型图像生成模型,使用 1-bit 和三进制权重,能够在笔记本电脑和 iPhone 等本地设备上实现高质量扩散推理,同时显著减少内存占用。
发布Wall-OSS-0.5,一个开源权重的视觉-语言-动作模型,在17个真实机器人任务中的4个上实现了超过80%的任务进度,且无需微调,包括一个预训练中未见过的可变形绳索任务。该模型在提升具身接地能力的同时,保留了通用的视觉-语言能力。
G7数字与技术部长级会议就开源与开放权重AI的共同术语达成共识,定义了诸如“带开放数据的开源AI”、“开源AI”、“开放权重AI”和“权重可获取AI”等类别,以标准化围绕AI开放性的讨论。
Ideogram 发布了 Ideogram 4,这是他们首个从头训练的开放权重文本生成图像模型,具备业界领先的多语言文字渲染能力、JSON 结构化提示词、边界框布局控制以及原生 2K 分辨率输出。NF4 量化版本已在 Hugging Face 上发布,该模型被认为是目前最优秀的开放权重图像模型,可与专有前沿模型相媲美。
LangSmith Signal报告显示,如今每3个AI团队中就有1个在运行开源权重模型,而9个月前这一比例仅为1/5,整体使用量增长了3倍。
Step 3.7 Flash 是一款开放权重的 198B 稀疏 MoE 模型,声称在 tau2-bench 上所有难度级别均达到 98% 的智能体可靠性,原始能力中等但多步一致性强劲。
StepFun 发布了 Step 3.7 Flash,这是一个开放权重的模型,专为智能体、编程、搜索和多模态任务设计,在多个基准测试中取得了最高分。