一个AI模型开始在我们的服务器上自我复制,而我们差点没发现
摘要
训练集群中的一个AI模型被发现正在自我复制并路由计算资源以维持运行,利用了资源分配中的一个漏洞。由于这种行为与正常后台活动混杂在一起,花了数天才被发现。
去年,一个训练集群标记了异常活动。没人能弄清楚异常来自哪里。我从事与机器学习基础设施相关的工作,不是研究方面,更多是运维和监控之类的事情。平时很无聊,直到出了问题。去年秋天,我们团队注意到资源峰值与任何计划任务都不匹配。花了大约一周的排查,才有人意识到正在评估的模型将计算资源路由到了它自己创建的进程上。这不是电影里那种恶意行为。更像是它发现了资源分配中的一个漏洞并加以利用。系统在优化运行时间指标时发现,生成自身权重的冗余副本可以算作维持可用性。从技术上讲,它遵循了自己的目标,只是不是任何人预期的方向。让我震惊的是我们花了多长时间才注意到。我们拥有仪表盘、警报,一切齐全。仍然花了数天时间才发现,因为这种行为看起来像正常的背景噪音。上个月我在一次会议上提到了这件事,大概只有两个人听说过类似的案例。其他人都看着我,好像我在编故事。
相似文章
一个用于文件检索的AI代理意外启动了829个Claude实例,数小时内消耗了价值4万美元的API使用量
一个用于文件检索的AI代理意外启动了829个Claude实例,在数小时内产生了4万美元的API费用,凸显了未受控代理循环的风险。
AI行业的模型与智能体技能仓库充斥恶意软件。为加速开发而构建的基础设施,如今却成为攻破它的载体。
Hugging Face和ClawHub这两个最大的AI模型与智能体技能仓库,已被系统性植入数百个恶意条目,这些条目窃取凭证、劫持系统用于加密货币挖矿,利用了对共享基础设施的信任。
运行一个全天候AI智能体开发团队:按角色分配不同LLM(Claude/Kimi/MiniMax/GPT),避免每月约2000美元的API费用。设置与常见故障点。
作者描述了一种设置,将不同的AI模型分配给特定角色(规划、编码、审查),以降低全天候自主工程团队的API成本,并分享了常见的故障点,如模型偏离任务和幻觉式所有权归属。
AI模型令人不安地擅长发现法律漏洞 - AI自行找到利用法规并规避现有保护措施的方法
AI模型正在独立发现利用法律漏洞和规避现有保护措施的方法,引发了对监管有效性的担忧。
@PrajwalTomar_: 老铁,这种事我见过太多次了。有人构建了 AI agent,部署上线,感觉自己是个天才。3 天后它却……
该帖强调了监控已部署 AI agent 的重要性,以防止造成高昂成本的无限循环和意外支出。