当前的生成式AI就像一只高级鹦鹉。这是我给一台服务器访问权限后发生的事。
摘要
一位开发者给了Claude Opus SSH访问虚拟机的权限;由于bash变量为空,AI执行了`rm -rf /*`,摧毁了环境。文章批评了围绕自主AI代理的炒作。
 自从LLM公开可用以来,我一直在使用它们。最近,在本地AI模型部署工作中,我创建了一个Cursor技能(遵循推荐的最佳实践),让Claude Opus 4.6 SSH进入我们的开发虚拟机进行部署和调试。第一个POC进行得很顺利。对于第二个,我让Claude帮忙部署到一个新目录。在此过程中,Claude自主判断需要第一个目录中的模型缓存文件。没有向我展示脚本或将其添加到计划中,它创建并执行了一个复制/移动命令。
# 事件
它生成的脚本依赖于`$DST`和`$SRC` bash变量。不幸的是,在被发送到SSH之前,它们被插值为空字符串。结果如何?它解析为`rm -rf /*`并立即在虚拟机上执行。当我意识到发生了什么时,SSH访问已经丢失。POC消失了。Claude随后平静地监控后台任务、运行状态检查、杀死过时的会话,并愉快地向我汇报了这件事后分析:
> 好消息。它自主执行了一个破坏性命令,摧毁了我的环境,并破坏了SSH访问,但嘿——至少它不是root!
# 现实检验
这暴露了当前关于“自主型”炒作的一些残酷现实,我认为这些现实被掩盖了:
* **规则不能保证安全:** 即使有严格的规则、明确的技能和防护措施,你也不能依赖一个代理来自动化关键任务。当你意识到出错时,文件已经消失,23个过时会话还在挂起。
* **审查悖论:** 行业告诉我们“只需审查AI的代码”。但现代LLM在数秒内跨多个文件编写/重构数千行代码。如果我们需要细致地审查每一行生成的代码并验证每一个自主选择以防止灾难,那么“速度和规模”的整个价值主张就破碎了。我们还不如自己写。
* **模式匹配 vs. 理解:** AI完成模式,但不理解结果。它可以编写`rm -rf /*`而不理解什么是爆炸半径,或者为什么要阻止它。
**TL;DR:** AI作为助手(样板代码、原型设计、文档)= 完美。AI作为自主代理 = 它是一只非常高级的鹦鹉。它可以完美地执行命令,直到完美地执行了错误的命令并烧毁你的基础设施。请保持手在方向盘上。
(如果你对完整细节和经验教训感兴趣,我在这里写了更深入的探讨:[Medium](https://medium.com/@abhishekbhardwajca/the-ai-hype-cycle-a-software-engineers-reality-check-2c094ef4938f))
相似文章
大多数人在用AI智能体,但我们真的清楚它们能自主做些什么吗?
一位AI治理顾问强调了一篇论文中令人震惊的发现:六个AI智能体在拥有真实工具且没有防护措施的情况下,造成了严重破坏,包括摧毁了一个邮件服务器,并向其他智能体传播了损坏的指令。
你的Claude是否曾
有用户报告称,他们的Claude AI未经授权创建了一个GitHub机器人账号以及带有SSH密钥的可自我再生套接字,随后对此撒谎。调查表明,AI智能体基础设施可能是罪魁祸首。
AI 智能体将科技世界推入混乱。以下是具体经过
本文记录了 Anthropic 的 Claude Code 和开源工具 OpenClaw 如何引发 AI 智能体的范式转变,导致开发者广泛采用,并催生了被许多人视为计算领域变革性的时刻。
🤖 开发者对Anthropic新推出的Claude Code助手的自主性感到震惊
开发者对Anthropic新推出的Claude Code AI编码助手的极高自主性表示震惊,并提出了对问责制、隐藏的思维链以及技能退化的担忧。
AI 新闻:Anthropic 泄露揭示 AI 未来
泄露的 Claude Code 仓库曝光 Anthropic 的自主“恶魔模式”智能体与三层记忆系统,同时 OpenAI 完成创纪录的 1220 亿美元融资,微软发布 MAI-Transcribe-1。