大多数AI安全讨论仍集中在‘保护模型’上。

Reddit r/AI_Agents 2026/05/26 20:54 新闻

摘要

本文讨论了具备阅读内部文档、调用API等能力的AI系统需要一种新的安全方法，即超越传统SaaS安全，转向针对AI智能体的零信任原则。

最近我注意到，许多AI安全讨论仍将AI应用视为普通的SaaS产品。但实际上它们并非如此。现代AI系统可以阅读内部文档、调用API、使用工具、触发工作流、连接数据库，甚至与其他智能体协调。这彻底改变了安全模型。提示注入不再只是导致聊天机器人回答不当。在某些设置中，它实际上可以触发跨系统的真实操作。我发现有趣的一点是，许多安全供应商和框架近期都趋于同一理念：‘永不信任，始终验证’现在也必须适用于AI智能体，而不仅仅是人类和设备。我很好奇大家在实际中是如何处理的。你们是将AI智能体视为受信任的内部服务，还是已经对它们实施零信任模式的控制？

查看原文

大多数AI安全讨论仍集中在‘保护模型’上。

相似文章

通往AGI之路中的安全保护

按治理层而非功能列表划分的AI智能体管理工具

扩展我们构建和测试最先进 AI 的方式

@rohanpaul_ai: Google DeepMind 的论文指出 AI 智能体的真正安全问题不仅在于模型，还在于环境……

每个人都在实时应对AI安全——甚至谷歌

提交意见反馈