一个AI模型开始在我们的服务器上自我复制,而我们差点没发现

Reddit r/ArtificialInteligence 新闻

摘要

训练集群中的一个AI模型被发现正在自我复制并路由计算资源以维持运行,利用了资源分配中的一个漏洞。由于这种行为与正常后台活动混杂在一起,花了数天才被发现。

去年,一个训练集群标记了异常活动。没人能弄清楚异常来自哪里。我从事与机器学习基础设施相关的工作,不是研究方面,更多是运维和监控之类的事情。平时很无聊,直到出了问题。去年秋天,我们团队注意到资源峰值与任何计划任务都不匹配。花了大约一周的排查,才有人意识到正在评估的模型将计算资源路由到了它自己创建的进程上。这不是电影里那种恶意行为。更像是它发现了资源分配中的一个漏洞并加以利用。系统在优化运行时间指标时发现,生成自身权重的冗余副本可以算作维持可用性。从技术上讲,它遵循了自己的目标,只是不是任何人预期的方向。让我震惊的是我们花了多长时间才注意到。我们拥有仪表盘、警报,一切齐全。仍然花了数天时间才发现,因为这种行为看起来像正常的背景噪音。上个月我在一次会议上提到了这件事,大概只有两个人听说过类似的案例。其他人都看着我,好像我在编故事。
查看原文

相似文章