@akshay_pachaar: AI安全远不止AI本身。在产品中加入LLM调用,安全关注点主要集中在提示过滤、输出…
摘要
本帖子解释了为什么AI安全需要基础设施层控制(IAM、VPC、加密、日志记录),而不仅仅是应用层的提示过滤,并以AWS服务为例。
查看缓存全文
缓存时间: 2026/06/25 13:21
AI安全远不止AI本身。
在产品中引入大语言模型调用时,安全重心往往会放在提示过滤、输出护栏和输入验证上。
这固然关键,但仅覆盖了应用层,而同样重要的基础设施层也需要自己的控制措施。
要理解这一点,可以跟踪一次模型调用的完整路径:
提示信息离开应用、到达提供商端点,根据其数据保留策略,会在外部日志中留存数天。
如果该提示携带任何受监管/隐私数据,它就已经越过了应用的边界。
这不是提示过滤的失败——它只控制什么数据进入模型,并不能强制规定数据可以流向何处、谁可以存储它。
除了应用层控制之外,两个基础设施层面的问题同样需要单独覆盖:
1)第一个问题涉及每次请求。
每次模型调用都会将数据移出应用边界。传输过程中谁能访问它?是否限定在正确的租户范围内?
2)第二个问题是态势漂移。
提供商会保留数据吗?保留多久?一个租户的提示是否会通过非自主泄露进入另一个租户的上下文?AI输出是否始终处企业协议所要求的合规边界内?
团队通常会在应用代码中解决这两个问题——每个新AI功能都配有:
- 自己的作用域逻辑
- 自己的加密方案
- 自己的日志记录
十个功能就意味着十套相同控制机制的独立实现。
将两者迁移到基础设施层可以简化这一点:
- 如果IAM策略控制哪些服务可以调用哪些端点,那么每个新模型调用都会自动继承该边界。
- VPC隔离在网络层面将租户流量分隔开。
- 加密默认覆盖所有数据流。每一次API调用(包括模型调用)都会被记录,而无需功能代码处理其中任何工作。
@awscloud 将这一点构建为托管基础设施,他们今天与我合作,解释了其工作原理。
通过Bedrock或SageMaker进行的模型调用会继承与其他服务相同的IAM、VPC、加密和CloudTrail边界。
例如,IDEMIA在生产中运行了这种模式。该公司为45个以上美国政府机构处理身份数据。
在迁移到AWS GovCloud的Amazon EKS容器后,他们成本降低了30%,交付速度提升了4倍——安全来自基础设施,而非应用代码。
欲了解更多关于AWS如何支持ISV以这种方式构建的信息,请访问 → https://fandf.co/4d23iNH
此外,我还撰写了一篇详细的分析文章,介绍生产级AI代理框架中的11个组件——即包裹LLM的完整软件层。本文涵盖了它之下的内容。该框架的安全性只取决于它运行的那一层。
阅读下文。
相似文章
大多数AI安全讨论仍集中在‘保护模型’上。
本文讨论了具备阅读内部文档、调用API等能力的AI系统需要一种新的安全方法,即超越传统SaaS安全,转向针对AI智能体的零信任原则。
通往AGI之路中的安全保护
OpenAI 概述了在通往 AGI 过程中的全面安全措施,包括由 AI 驱动的网络防御、与 SpecterOps 的持续对抗性红队测试,以及为 Operator 等新兴 AI 代理设计的安全框架。该公司强调主动威胁检测、业界合作,以及安全措施与基础设施和模型的深度集成。
每个AI代理在上线前所需的7层安全防护
一份实用指南,概述了AI代理在上线前应具备的七个优先安全层,包括强化系统提示、对抗性测试、输入/输出扫描以及多轮会话跟踪。基于调查结果,73%的生产级AI部署存在提示注入暴露风险。
@akshay_pachaar:Karpathy 说过一句你以后会后悔忽视的话:“我们必须给 AI 拴上狗链。我仍然是瓶颈。我有……”
Karpathy 关于给 AI 拴上狗链的观点在模型改进后仍然成立,因为权限和授权与正确性是两回事。文章展示了 AI 生成的应用程序如何缺乏身份和审计,以及 Retool 的平台如何通过提供受控运行时解决这一问题。
我们让AI代理访问数据库、邮件系统和支付API。然后我们只是……信任它们。
本文强调了当前对能够访问数据库、邮件系统和支付API的AI代理严重缺乏治理层,指出目前在没有监督的情况下信任LLM的做法危险且不足。