英伟达的开源攻势、OpenAI与亚马逊交易、Grok降低视频价格、递归语言模型

The Batch 新闻

摘要

本文讨论了反AI宣传的努力,并重点介绍了近期AI行业新闻,包括英伟达的开源举措、OpenAI与亚马逊的交易、Grok降低视频价格以及递归语言模型。

The Batch AI新闻与分析:反AI联盟继续运作,试图找到论据来减缓AI的进展。
查看原文
查看缓存全文

缓存时间: 2026/05/08 06:25

# 英伟达的开放攻势、OpenAI 的亚马逊合作、Grok 降低视频价格等 来源:https://www.deeplearning.ai/the-batch/issue-346/ 亲爱的朋友们, 反 AI 联盟继续寻找论据以减缓 AI 的进步。如果有人对 AI 的特定影响(例如,它可能导致人类灭绝)有真诚的担忧,我尊重他们理智上的诚实,即使我深不赞同他们的立场。然而,我担心的是那些正在调查公众,试图找到任何能让人们反对 AI 的信息的组织,以及当这些信息被游说者或寻求引起选民恐慌的政客、试图进行监管捕获或推广其技术实力的公司、以及寻求关注或通过挑衅获利的人传播时,公众的反应。 一项由英国团队进行的大型研究(https://zenodo.org/records/18937001/files/Which%20AI%20harms%20and%20risks%20will%20mobilise%20the%20public%20to%20act%20-%20Social%20Change%20Lab%20-%20March%202026.pdf?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)(感谢 AI Panic (https://www.aipanic.news/p/study-the-public-isnt-concerned-or?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz) 博客的提示)测试了旨在引发 AI 恐慌的不同信息。他们的研究发现,说 AI 会导致人类灭绝基本上已经失败了。两年前,末日预言者还在推动这个论点,幸运的是,我们的社区击退了它。但 AI 增强的战争和环境问题更能引起共鸣。我们应该准备好应对大量(已经正在进行中的)基于这些理由反对 AI 的信息。此外,失业和对儿童的伤害也是能促使人们采取行动的信息。 澄清一下,我觉得 AI 增强的战争令人担忧;我们需要继续认真努力监测和减轻 AI 对环境的影响;任何失业都是悲剧,伤害个人和家庭;作为一位父亲,我非常珍视每个孩子福祉的重要性。这些话题每一个都需要认真对待,并给予最大的关怀。 但是,当反 AI 宣传者以牺牲广大公众为代价,片面看待复杂问题以使自己组织受益时——例如,当大型 AI 公司声称 AI 很危险,以阻止免费分发的开源项目(这些项目与它们的产品竞争)时——那么我们都输了。 例如,公众对数据中心环境影响的看法已经远不如现实(https://www.deeplearning.ai/the-batch/data-centers-are-more-easier-on-the-environment-than-you-might-think/?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)——数据中心就其完成的工作而言极其高效,阻碍其建设将损害而非帮助环境。虽然失业是一个真实的问题,但“AI 洗白”裁员——即疫情期间过度招聘的企业将最近的裁员归咎于 AI,尽管 AI 尚未影响其运营——导致了对 AI 对就业影响的过分夸大恐惧。 漫画风格中,一位女士警告一位坐在电脑前的男士关于 AI 导致人类灭绝和失业的问题。不幸的是,这种宣传很容易导致对每个人都产生更坏结果的法规。例如,石油公司多年来一直致力于制造对核能的恐惧。结果,对核电站安全性的过分担忧抑制了核能发展,导致因其他能源造成的空气污染而导致的数百万人过早死亡,以及二氧化碳排放量的大幅增加。让我们确保不要因为对 AI 的过分担忧,导致那些本可以从更快的 AI 发展中受益的许多人面临类似的命运。 本周,白宫提出了一个国家级的 AI 立法框架。一个关键组成部分是联邦优先权框架,以防止各州出台阻碍 AI 发展的零散法规。我支持这一点。 在未能获得联邦层面的支持后,许多反 AI 宣传已经转向州级。如果 50 个州中只有一个通过了对 AI 限制过度、无益的法律,就可能抑制所有州乃至全球的 AI 发展。白宫的提案尊重各州在控制自己分区、执行通用法律保护消费者以及如何使用 AI 方面的权利。但如果某个州通过了限制 AI 发展的法律,联邦规则将优先于该州法律。 目前,白宫的提案仍然只是一个提案。然而,如果美国国会通过它,将为持续以有益方式发展 AI 的努力扫清道路。 我们接下来该怎么做?让我们支持限制那些(无论是否使用 AI)对人们造成伤害的应用。当反 AI 联盟反对 AI 时,除了考虑论点的合理性,我还考虑他们的立场是否一致且有说服力,或者他们是否只是在推广任何他们认为在特定时刻能影响公众的担忧。而且,让我们继续使用科学方法来权衡 AI 的好处与可能的伤害,这样我们就不会因为过分担忧而限制了 AI 能为每个人带来的好处。 继续建设吧! Andrew --- ## DEEPLEARNING.AI 的消息 “Anthropic 的 Agent Skills”(https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/)的宣传横幅。“Anthropic 的 Agent Skills”向您展示如何通过将工作流逻辑从提示中移出并放入可复用的技能中,使 Agent 更加可靠。学习如何在编码、数据分析、研究和其他工作流中设计和应用技能。立即注册!(https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/) ## 新闻 该图表比较了 Nemotron 3 模型在准确性和处理速度方面与其他 AI 模型的性能。 ## 开源速度狂魔 英伟达,AI 芯片的主导供应商,发布了一个有竞争力的开源大语言模型,其速度在其尺寸级别中名列前茅——这是自去年 Meta 发布 Llama 4 以来,美国出现的第一个开放权重领先者。 **新消息:** 英伟达发布了(https://developer.nvidia.com/blog/introducing-nemotron-3-super-an-open-hybrid-mamba-transformer-moe-for-agentic-reasoning/?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)Nemotron 3 Super 120B-A12B,一个专为智能体应用设计的大语言模型,不仅提供了权重,还包括训练数据集和配方。它是计划中三个模型家族中的第二个:英伟达在 2025 年 12 月发布了 Nemotron 3 Nano-39B-A3B,Nemotron 3 Ultra-500B-A50B 即将推出。 - **输入/输出:** 文本输入(最多 100 万个 token),文本输出(最多 100 万个 token) - **知识截止:** 2025 年 6 月(预训练数据),2026 年 2 月(微调数据) - **架构:** 混合 mamba-2/transformer/专家混合(MoE),带有多个 token 预测层(1200 亿参数,每 token 120 亿激活) - **训练数据:** 25 万亿 token 的精选数据,来自网络抓取和合成,涵盖 20 种自然语言和 43 种编程语言 - **特性:** 工具调用、结构化输出、七种语言(中文、英语、法语、德语、意大利语、日语、西班牙语)、推理模式(关闭、低、常规) - **性能:** 在其尺寸范围内最快(每秒 442 个输出 token),在 PinchBench 智能体任务测试中领先开放权重模型 - **可用性/价格:** 权重和数据集免费下载(https://huggingface.co/collections/nvidia/nvidia-nemotron-v3?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz),许可允许非商业和商业用途(如果安全防护被移除且不替换,或用户对英伟达提起专利或版权诉讼,权利将终止),通过英伟达(https://build.nvidia.com/nvidia/nemotron-3-super-120b-a12b?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)和 OpenRouter 免费聊天,通过第三方提供商 API 约 0.30/0.80 美元每百万输入/输出 token。 **工作原理:** Nemotron 3 Super 的混合架构交错使用 mamba-2、注意力和修改后的 MoE 层,以及多 token 预测头,每次前向传递生成多个 token。 - Nemotron 3 Super 的大部分层是 mamba-2(https://arxiv.org/pdf/2405.21060?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)层。与注意力层(随着输入长度增加,处理能力呈二次方增长)不同,mamba-2 层在每一步将较早的上下文压缩成紧凑的表示。Nemotron 3 Super 选择性地插入注意力层,以处理需要从输入远处精确检索的任务,而 mamba-2 层在这方面表现不佳。 - MoE 层使用英伟达的 LatentMoE(https://arxiv.org/abs/2601.18089?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)设计,在 MoE 路由器决定激活哪些专家之前,将每个 token 的表示压缩到通常大小的 1/4。这种压缩使得模型每 token 可以激活 22 个专家,而处理能力大致相当于通常激活五六个专家所需的。 - 多 token 预测(MTP)头在每次前向传递中预测多个输出 token。在训练期间,这鼓励模型学习更长范围的模式。在推理期间,MTP 头通过草拟 token 加速输出,模型在一次传递中验证这些 token。它保留与其概率分布一致的 token,丢弃其余的。 - 团队使用 NVFP4(英伟达 Blackwell GPU 架构内建的 4 位浮点数格式)进行预训练,因此模型学会了以降低精度工作,而不是在训练后进行量化。 - 团队对超过 700 万个序列进行了微调,每个序列包含提示、推理、工具调用和最终输出。这些序列由 DeepSeek V3.2 和 Kimi K2 为某些任务生成(包括数学、代码和多语言查询),以及由 Qwen3-Coder-480B 为软件工程任务生成。随后进行了三个阶段强化学习:具有客观可验证输出的任务领域(如数学、编码、科学、谜题和智能体工具使用);一个专门的软件工程阶段,模型使用测试执行作为奖励信号解决 GitHub 问题;以及从人类反馈中进行强化学习以提高对话质量。团队在一篇论文(https://arxiv.org/pdf/2603.21383?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)中描述了其 PivotRL 微调方法。 **性能:** Nemotron 3 Super 在其尺寸类别中在速度和长上下文处理方面领先,在整体智能和智能体任务方面的指标也具有竞争力。 - Nemotron 3 Super 设置为推理(未指定级别)时生成(https://artificialanalysis.ai/models/nvidia-nemotron-3-super-120b-a12b?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)约每秒 442 个 token,远远领先于 OpenAI gpt-oss-120b 设置为高推理(每秒 278 token)和 Google Gemini 3.1 Flash-Lite 设置为推理(每秒 266 token)。 - 在 Artificial Analysis 的智能指数上(10 个专注于经济上有用工作的基准的加权平均值),Nemotron 3 Super 设置为推理(36)落后于 Qwen3.5-122B 设置为推理(42),但优于 gpt-oss-120b 设置为高推理(33)。 - 在 RULER(https://arxiv.org/abs/2404.06654?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)(英伟达开发的长上下文评估)上,给定 100 万个输入 token,Nemotron 3 Super(91.75% 准确率)略微优于 Qwen3.5-122B(91.33% 准确率),并远远领先于 gpt-oss-120b(22.30% 准确率)。 - 在 PinchBench(https://pinchbench.com/?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=email&_hsenc=p2ANqtz-9o2Recq645Sh94dkQERF-s-TPwoF7fmy7Bw20yk8Bg7em33UUSAF9nnQ3hCwDYUj56R_zz)上(评估模型作为自主代理(OpenClaw)决策核心完成任务的能力),Nemotron 3 Super(85.6%)优于更大的开放权重竞争者,包括 1 万亿参数的 Kimi K2.5(84.8%)和 7440 亿参数的 GLM-5(84.1%),以及类似尺寸的 Qwen3.5-122B(84.5%)。 **幕后消息:** 英伟达计划五年内投资 260 亿美元开发开放权重模型——这是一个重大承诺。该公告恰逢开放权重格局的变化,这可能会影响英伟达的业务。中国公司,包括阿里巴巴、Moonshot AI 和 Z.ai,最近构建了最强大的开放权重模型,并且他们正在构建英伟达 GPU 和 Cuda 软件的替代品。例如,据报道 DeepSeek 完全在华为的 Ascend 芯片和 Cann 软件上训练了一个即将推出的模型。 **为何重要:** Nemotron 3 Super 为开发者提供了一个用于智能体应用的快速、完全开放的模型,除了权重外还包括训练数据、配方和工具。这种开放性也有助于英伟达的商业目标。中国的开放权重模型越来越强大,并且越来越优化以在非英伟达芯片上运行,这造成了一个风险:以往依赖英伟达的开发者可能会转向其他选择。Nemotron 给了他们一个不这样做的理由。 **我们的想法:** 谁能比设计 GPU 的公司更适合优化 GPU 模型呢?从自定义数值格式到推理软件,英伟达能够以很少有模型开发者能匹敌的方式协同设计硬件和软件。英伟达正在押注:构建模型有助于销售芯片,反之亦然。 --- 在深色星空背景上重复出现霓虹色的 OpenAI 标志,包围在一个浅蓝色云框中。 ## OpenAI 在 AWS 上跟踪 Agent 状态 OpenAI 与亚马逊合作,在世界上最大的云平台上构建用于 Agent 的基础设施,这进一步表明其与微软的密切关系正在减弱。 **新消息:** OpenAI 和亚马逊宣布了一个“有状态运行时环境”,这是一个为 AI Agent 设计的即将推出的计算基础设施。两家公司没有透露预计的发布日期。这项合作使 OpenAI 的计算资源多样化,不再局限于 Microsoft Azure,并让亚马逊能够在其自身产品中使用 OpenAI 模型。作为交易的一部分,亚马逊投资了(https://openai.com/index/amazon-partnership/?utm_campaign=The%20Batch&utm_source=hs_email&utm_medium=e(此处原文截断,但根据上下文,应该是一个链接)

相似文章

过去24小时AI领域发生了什么

Reddit r/artificial

重大AI发展汇总:SpaceX与谷歌签署每月9.2亿美元的协议,采购11万块Nvidia芯片;特朗普政府考虑在顶级AI公司中持有股权;Meta的自动化AI支持系统被黑客入侵,接管高知名度账户;技术工人从手动劳动转向借助AI的战略任务。