我构建了一个开源中间件,防止AI智能体超出花费/策略限制——v0.2现已发布

Reddit r/AI_Agents 工具

摘要

ActionFence 是一个开源中间件,可为 AI 智能体和 MCP 服务器强制执行花费上限、策略限制和安全检查。v0.2 版本新增了滚动窗口上限、断路器以及模式漂移检测等功能。

大家好,我正在构建 **ActionFence**,一个面向 AI 智能体工具、MCP 服务器和 API 的开源中间件层。目标很简单:在智能体执行动作之前,ActionFence 会检查该动作是否被允许。例如: * 这个智能体能调用这个工具吗? * 智能体是匿名、基于令牌还是已验证的? * 这个动作是否超过了允许的花费上限? * 智能体是否超过了每日/会话限制? * 这个动作需要人工审批吗? * 自策略编写以来,工具模式是否发生了变化? 您可以在 JSON 策略文件中定义规则,然后封装您的 MCP 服务器或 Express API: `withGuard(server, { policy: './guard-policy.json' })` 我之前在 Reddit 上发布了早期版本,收到了很好的反馈,因此我将其更新到了 v0.2,并创建了一个着陆页。 v0.2 新增功能: * 滚动窗口花费上限 * 全局断路器 * 人工审批回调 * 模式漂移检测 * PostgreSQL 存储适配器 * 通配符动作匹配 * 限制内省 API * 收据负载脱敏 * 安全修复:JWT 验证、路径遍历、竞态条件和收据一致性 我正在寻求构建智能体或智能体工具的人们的反馈。主要问题: 1. 您会在智能体工具前面使用这样的东西吗? 2. 还缺少哪些策略规则? 3. “AI 动作防火墙”这个定位是否合适,或者是否有其他术语能更好地解释? 4. 着陆页是否清晰?
查看原文

相似文章

AgentWall:面向本地AI代理的运行时安全层

arXiv cs.AI

本文介绍了AgentWall,一个面向本地AI代理的运行时安全层。它能在执行前拦截操作、执行声明性策略、对敏感操作要求人工审批,并记录防篡改的操作轨迹。该项目开源,支持多个代理平台。

开源用于AI代理的Shell级别安全层

Reddit r/AI_Agents

开源一个Shell级别的控制层,该层阻止危险命令、暴露虚假秘密并强制执行运行时策略,使AI代理在开发环境中更安全、更确定。