NVIDIA 刚刚发布了用于自动驾驶出租车的 32B 开源推理模型

Reddit r/artificial 模型

摘要

NVIDIA 宣布推出 Alpamayo 2 Super,这是一款面向 L4 级自动驾驶出租车的 32B 开源推理模型,具备 360 度感知、元动作等功能,并提供包括 AlpaGym 仿真和 OmniDreams 场景生成在内的全套技术栈。

NVIDIA 今天宣布推出 Alpamayo 2 Super:这是一款面向 L4 级自动驾驶出租车开发的 32B 视觉-语言-动作模型。有趣之处不仅在于模型规模,更在于 NVIDIA 所推动的技术栈形态: - 一个更大的开源"教师"模型,用于感知、推理、规划与动作 - 360 度环绕感知,而非仅依赖前向摄像头推理 - 高级"元动作"(如让行、变道、停车),而非仅轨迹预测 - 推理自动标注,将驾驶片段转化为因果训练数据 - AlpaGym 用于仿真环境中的闭环强化学习 - OmniDreams 用于生成罕见/长尾驾驶场景 这似乎意味着更大的趋势:自动驾驶正从"基于录制的驾驶数据训练并预测轨迹"转向能够在仿真循环中训练、评测、蒸馏和测试的基座模型式推理系统。显而易见的警示是:这仍然是 NVIDIA 的定位,并非证明自动驾驶出租车问题一夜之间被解决。模型权重预计今年夏天发布,实际验证才是难点。但如果开放自动驾驶基座模型成为常态,小型自动驾驶团队或许无需从头重建相同的感知/规划基础设施,而是开始在数据、安全验证、部署约束和闭环测试上竞争。来源:NVIDIA 新闻稿 https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Launches-Alpamayo-2-Super-Open-Reasoning-Model-for-Robotaxis/default.aspx
查看原文

相似文章

Nvidia Cosmos 3

Hacker News Top

NVIDIA 开源了 Cosmos 3,这是一个物理AI的前沿基础模型,将推理、世界生成和动作生成统一在单一的 Mixture-of-Transformers 架构中,并发布了用于机器人、自动驾驶和仓库监控的模型检查点、数据集和训练脚本。

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

Hugging Face Models Trending

NVIDIA 发布 Nemotron 3 Nano Omni,一款 300 亿参数的多模态模型,能够处理视频、音频、图像和文本,并集成推理能力,适用于企业工作流。