我不认为你能攻破Bendex Arc。证明我错了。

Reddit r/AI_Agents 工具

摘要

Bendex Arc是一款通过追踪完整会话以抵御提示注入攻击的工具。经独立验证,面对能击败所有其他测试工具的各类攻击时,其防御有效率达到100%。

我测试过的每个提示注入工具都以同样的方式失败。将一次攻击分散到8条消息中,每条消息看起来都干净。到第8条消息时,代理已被攻陷而没有任何触发。Bendex Arc追踪整个会话而非单条消息。TAB Platform独立验证了它——面对所有其他测试工具都无法防御的攻击时,成功防御率达到100%。我希望有人能攻破它。链接在评论中。
查看原文

相似文章

你的AI代理刚刚被劫持了,而你却毫不知情。

Reddit r/artificial

本文警告了一种名为Crescendo攻击的多轮提示注入技术,它通过在多轮对话中污染AI代理的上下文来绕过单条消息的防御。文章介绍了Bendex Arc,一种跨会话追踪行为轨迹的工具,能在攻击执行前将其捕获。