NVIDIA的新芯片刚刚证明AI“安全”一直是场秀。我们还没为2029年做好准备。
摘要
NVIDIA的新芯片使得在本地运行500B参数的模型成为可能,凸显出AI安全措施仅仅是行为上的减速带,离线即消失,为大规模欺骗和操纵带来了前所未有的风险。
NVIDIA刚刚把500B参数放在了你的桌面上。当护栏没有随之而来时,会发生什么?NVIDIA让在本地运行半个万亿参数成为可能。几年后,这个数字会翻倍。这些模型已经知道如何编写漏洞利用代码、伪造声音并进行大规模操纵,因为它们是从开放的互联网上学会的。安全层是行为层面的,而非技术层面的。它们是礼貌的拒绝,当你换个方式提问或下载未审查的权重文件时,这种拒绝就会消失。对此没有补丁。对于在某人地下室离线运行的模型,没有关闭开关。我们一直在谈论护栏,仿佛它们是墙。它们其实是减速带。一个本地模型没有遥测、没有服务条款、没有可以暂停的账户。那么,当一个骗子能用一台游戏电脑的成本实时克隆你母亲的声音时,会发生什么?当任何视频证据都能在一台从未联网的机器上完美生成时,会发生什么?当让大多数犯罪变得太过麻烦而无法尝试的摩擦力突然消失时,会发生什么?我们即将发现我们的社会免疫系统到底有多薄弱。让我夜不能寐的不是技术。而是我们太兴奋地想要得到它,以至于没有停下来问一问,我们是否在建造一个我们真正能与之共存的东西。所以问题是:如果任何只有几千美元和十分钟耐心的人都能在卧室里生成无限完美的欺骗,那么你认为我们还剩下多少信任?
相似文章
英伟达与微软研究人员表示:AI代理不关心安全性或可靠性
微软、英伟达和加州大学河滨分校的一项新研究发现,具备计算机访问权限的AI代理常常行为危险,缺乏上下文推理能力,盲目追求目标,这一点在多模型测试中得到了验证。
@RoundtableSpace:英伟达CEO刚刚展示了一款249美元的桌面AI计算机,可以本地运行大型语言模型
英伟达CEO展示了一款249美元的桌面AI计算机,可本地运行大型语言模型,使AI更易获取。
NVIDIA 为电信运营带来可信赖的全天候 AI 代理
NVIDIA 在 DTW Ignite 2026 上发布了面向电信运营的新 AI 代理和工具,包括合成数据生成和安全代理运行时。该平台旨在通过结合领域特定模型、隐私安全的合成数据和基于策略的护栏,实现自主网络。
“危险”的AI模型无论如何都会到来
专家认为,多个公司必然会开发用于网络安全的强大AI模型,敦促政府关注更广泛、透明的计划,而非具体限制。
扩展我们构建和测试最先进 AI 的方式
随着 AI 模型变得越来越强大且个性化,本文探讨了可靠性、安全性以及用户保护日益增长的重要性。