我的AI代理总是误解我的业务逻辑。所以我构建了一种不同的方式来传递它。
摘要
作者构建了一个基于浏览器的编辑器,用于名为Rulemapping的方法论,以将明确的业务逻辑传递给AI代理,通过分离规则定义与执行来减少误解。
有些事情一直困扰着我和AI代理一起工作的方式。明显的案例总是运行良好。但边缘情况每次都失败得不同,即使使用相同的规则。我曾一度认为这是提示工程的问题,但其实不是。我还尝试过使用Mermaid图,这有助于提高可读性,但问题依旧:代理仍然需要根据上下文解释节点或边的实际含义。自然语言和可视化自由形式图有同样的问题:它们没有将规则的定义与应用分开。因此,每次模型遇到模糊情况时,它就会猜测。有时正确,有时不正确。我开始研究Rulemapping,这是一种最初用于使法律文本机器可读的方法论。这个想法立刻让我觉得可行:明确定义逻辑,这样代理只需执行,无需解释。解释工作留给构建地图的我。因此,我构建了一个基于浏览器的编辑器。你可以用类型化的节点(Decision, Condition, Consequence, Action, Input Data)可视化地定义逻辑,并将其导出为JSON或Markdown直接放入代理的上下文中。构建过程中出现了一些我未曾预料到的事情:结构迫使你在代理之前发现自己的空白,验证会在JSON到达模型之前标记死胡同,每个节点可以带有一个绑定级别,以便代理知道哪些可以偏离,哪些不能。很好奇其他人如何处理这个问题。你是如何将复杂逻辑传递给代理的?
相似文章
我的AI代理在遇到未曾预料的问题之前工作得很好。是继续添加规则,还是重新思考整体方法?
一位开发者描述了构建多代理AI助手的挑战:这些助手无法优雅地处理意外情况,依赖显式规则导致打地鼠式问题,而非实现关于模糊性的自主推理。
AI 代理依然拉胯,于是我自己造了一个
作者构建了一款自定义 AI 代理应用,封装了 Claude Code 并即将支持 Codex,侧重于可组合的工作流,并期待社区反馈。
需要直率反馈:我构建了一个用于记录AI代理运行的工具
一位开发者构建了agentproof-recorder来记录AI代理运行并检测规则违规,寻求反馈这是否是一个常见的痛点。
一位客户付钱让我把他们工具中的AI移除。
一位开发者构建了一个基于LLM的工单路由工具,但支持团队不信任其黑箱决策。客户付费将LLM替换为简单的规则引擎,结果准确率更高、成本更低、用户信任度也更高。
代理规则必须存在于操作发生的地方
本文主张,人工智能代理的安全规则应作为硬性工作流约束和权限来实现,而非仅依赖提示词指令。文章强调对于敏感或不可逆的操作,需要明确的检查、审批和日志记录。