NVIDIA 刚刚发布了用于自动驾驶出租车的 32B 开源推理模型
摘要
NVIDIA 宣布推出 Alpamayo 2 Super,这是一款面向 L4 级自动驾驶出租车的 32B 开源推理模型,具备 360 度感知、元动作等功能,并提供包括 AlpaGym 仿真和 OmniDreams 场景生成在内的全套技术栈。
NVIDIA 今天宣布推出 Alpamayo 2 Super:这是一款面向 L4 级自动驾驶出租车开发的 32B 视觉-语言-动作模型。有趣之处不仅在于模型规模,更在于 NVIDIA 所推动的技术栈形态:
- 一个更大的开源"教师"模型,用于感知、推理、规划与动作
- 360 度环绕感知,而非仅依赖前向摄像头推理
- 高级"元动作"(如让行、变道、停车),而非仅轨迹预测
- 推理自动标注,将驾驶片段转化为因果训练数据
- AlpaGym 用于仿真环境中的闭环强化学习
- OmniDreams 用于生成罕见/长尾驾驶场景
这似乎意味着更大的趋势:自动驾驶正从"基于录制的驾驶数据训练并预测轨迹"转向能够在仿真循环中训练、评测、蒸馏和测试的基座模型式推理系统。显而易见的警示是:这仍然是 NVIDIA 的定位,并非证明自动驾驶出租车问题一夜之间被解决。模型权重预计今年夏天发布,实际验证才是难点。但如果开放自动驾驶基座模型成为常态,小型自动驾驶团队或许无需从头重建相同的感知/规划基础设施,而是开始在数据、安全验证、部署约束和闭环测试上竞争。来源:NVIDIA 新闻稿 https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Launches-Alpamayo-2-Super-Open-Reasoning-Model-for-Robotaxis/default.aspx
相似文章
Nvidia Cosmos 3
NVIDIA 开源了 Cosmos 3,这是一个物理AI的前沿基础模型,将推理、世界生成和动作生成统一在单一的 Mixture-of-Transformers 架构中,并发布了用于机器人、自动驾驶和仓库监控的模型检查点、数据集和训练脚本。
NVIDIA 推出 Cosmos 3,面向物理AI的开放前沿基础模型(5分钟阅读)
NVIDIA 发布 Cosmos 3,这是一个面向物理AI的开放基础模型,采用混合Transformer架构,支持推理、世界模拟和动作生成,适用于机器人和自动驾驶车辆。
NVIDIA OmniDreams:用于闭环自动驾驶仿真的实时生成式世界模型
NVIDIA推出OmniDreams,这是一个基于Cosmos扩散模型构建的生成式世界模型,用于实时动作条件视频生成,能够在复杂的未见场景中实现自动驾驶策略评估的闭环仿真。
欢迎 NVIDIA Cosmos 3:首个用于物理AI推理与行为的开放全能模型
NVIDIA Cosmos 3 是一个面向物理AI的开放全能模型,它将世界生成、推理和行为生成统一到一个模型中,现已可在 Hugging Face 上获取,并提供多种资源。
nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16
NVIDIA 发布 Nemotron 3 Nano Omni,一款 300 亿参数的多模态模型,能够处理视频、音频、图像和文本,并集成推理能力,适用于企业工作流。