我认为AI代理将需要一个操作层

Reddit r/artificial 产品

摘要

作者认为,随着AI代理变得越来越自主,需要一个治理层来实现控制、可观测性和可审计性,并介绍了Bendex Arc作为解决方案,其组件包括Arc Gate、Arc Replay、Arc Approve和Arc Memory。

AI系统越自主,我就越觉得单独的安全工具已经不够用了。现在我们有拥有工具访问权限、浏览器访问权限、MCP服务器、记忆、工作流、外部动作以及长时间运行会话的代理。大多数讨论都集中在模型上。我认为更大的问题是治理。谁批准高风险操作?如何阻止被污染的内容变成指令?如何事后审计发生了什么?如何跟踪记忆漂移?如何重放故障?如何在不同模型和代理框架之间一致地执行策略?这就是我一直在构建Bendex Arc的原因。思路很简单:在AI系统与真实世界行为之间放置一个控制平面。Arc Gate负责运行时治理。Arc Replay负责可观测性。Arc Approve负责人工审批工作流。Arc Memory专注于记忆完整性。我认为最终的赢家不会是功能最多的公司,而是能让自主系统变得可理解、可控制和可审计的公司。我很好奇其他构建代理的人是否认为我们正在走向这样一个未来:每一个严肃的部署都会有一个治理层,就像每一个严肃的应用程序都有日志、监控和访问控制一样。演示:https://web-production-6e47f.up.railway.app/demo GitHub:https://github.com/9hannahnine-jpg/arc-gate
查看原文

相似文章

可信赖的智能代理AI层

Reddit r/AI_Agents

作者正在构建Synapsor,一个面向AI代理的测试版工具,提供受管内存、分阶段写入、回放、权限和审计追踪,并正在寻求代理开发者的反馈。

AI代理是否正在成为新的软件抽象层?

Reddit r/AI_Agents

作者探讨了AI代理如何作为现有软件的新的抽象层,将用户交互从导航用户界面转向描述结果,从而减少将意图转化为可执行任务时的摩擦。