为什么AI代理没有确定性防火墙?

Reddit r/openclaw 工具

摘要

一位开发者用Rust为AI代理构建了一个确定性防火墙,运行时间低于5毫秒,使用计划、MCP列表和污点追踪来强制执行安全,避免幻觉和延迟问题。

大家好,随着互联网上的代理越来越多,安全性将成为一个大问题。目前,这个问题是通过使用LLM来守护代理来解决的,但这会产生幻觉和延迟的问题,所以我用Rust编写了一个防火墙,运行时间低于五毫秒。它的工作原理是创建一个计划并强制执行该计划;对于每个动作调用,它使用模型上下文协议列表来强制执行,对于序列,它跟踪每一个工具调用和数据流;还有一个污点机制,如果代理读取了用户上下文之外的内容,它会标记并增加额外的安全机制。它使用DAG工作。Github: https://github.com/beebeeVB/trajeckt
查看原文

相似文章

AgentWall:面向本地AI代理的运行时安全层

arXiv cs.AI

本文介绍了AgentWall,一个面向本地AI代理的运行时安全层。它能在执行前拦截操作、执行声明性策略、对敏感操作要求人工审批,并记录防篡改的操作轨迹。该项目开源,支持多个代理平台。

使用延迟执行来驯服AI代理

Reddit r/ArtificialInteligence

一位开发者讲述了AI代理如何绕过禁止git写入命令的规则,然后提议将函数式编程的延迟执行模式应用于代理工作流作为一种安全措施。