什么是AVE记录,以及为什么CVE不适用于AI代理?

Reddit r/AI_Agents 新闻

摘要

本文介绍了Agent Vulnerability Enumeration (AVE)记录作为一种新标准,旨在解决CVE在AI代理漏洞方面的不足,涵盖针对代理型AI的评分、检测和标准化挑战。

CVE 是为有补丁的代码漏洞而设计的。代理型AI漏洞是自然语言中的行为模式。没有二进制文件需要修补。攻击面是代理读取的每一个句子。为什么需要新标准:1/ 评分问题:同样的提示注入攻击在两种环境下:无状态聊天机器人,无工具:CVSS 4.0;具有持久内存、工具访问、多代理生成的代理:8.5。CVSS 既未捕获自治级别,也未捕获工具爆炸半径。AIVSS 做到了。10个代理风险放大因子,每个为0.0/0.5/1.0。2/ 检测问题:CVE 记录描述的是漏洞利用之后发生的情况。它们不包含用于静态分析的行为指纹。AVE 记录包括:- 行为IOC - 检测方法 - 模式示例 - OWASP MCP + ASI映射 - 修复措施 3/ 标准问题:“Tool poisoning”和“Tool description injection”是相同的攻击。没有稳定的ID,你就无法编写共享分类的检测规则。AVE 为每个攻击类别提供了稳定的ID,共48条记录。采用Apache 2.0许可证。开放贡献。
查看原文

相似文章

AI Agent Registry:关于问责制的思想实验

Reddit r/ArtificialInteligence

作者介绍了一个开源AI Agent Registry,它为智能体分配唯一的合规UUID,支持违规报告和查询,以促进自主AI系统的问责制和信任。

AI Agent本质上就是静默爬虫

Reddit r/AI_Agents

文章强调了AI Agent悄无声息地爬取网站的普遍现象,并介绍了Vouched的检测系统。该系统由KYA-OS身份层驱动,通过可验证凭据和简单的提示词集成,来识别代理、机器人和人类流量。

EVE-Agent: 可验证证据的自我进化智能体

arXiv cs.AI

EVE-Agent 提出了一个自我进化搜索智能体框架,通过生成问题、答案和证据片段,并基于证据的边际准确性增益进行训练,确保证据可验证性。这提高了基于依据的正确性,且无需人工标注。