我的AI代理总是误解我的业务逻辑。所以我构建了一种不同的方式来传递它。

Reddit r/AI_Agents 工具

摘要

作者构建了一个基于浏览器的编辑器,用于名为Rulemapping的方法论,以将明确的业务逻辑传递给AI代理,通过分离规则定义与执行来减少误解。

有些事情一直困扰着我和AI代理一起工作的方式。明显的案例总是运行良好。但边缘情况每次都失败得不同,即使使用相同的规则。我曾一度认为这是提示工程的问题,但其实不是。我还尝试过使用Mermaid图,这有助于提高可读性,但问题依旧:代理仍然需要根据上下文解释节点或边的实际含义。自然语言和可视化自由形式图有同样的问题:它们没有将规则的定义与应用分开。因此,每次模型遇到模糊情况时,它就会猜测。有时正确,有时不正确。我开始研究Rulemapping,这是一种最初用于使法律文本机器可读的方法论。这个想法立刻让我觉得可行:明确定义逻辑,这样代理只需执行,无需解释。解释工作留给构建地图的我。因此,我构建了一个基于浏览器的编辑器。你可以用类型化的节点(Decision, Condition, Consequence, Action, Input Data)可视化地定义逻辑,并将其导出为JSON或Markdown直接放入代理的上下文中。构建过程中出现了一些我未曾预料到的事情:结构迫使你在代理之前发现自己的空白,验证会在JSON到达模型之前标记死胡同,每个节点可以带有一个绑定级别,以便代理知道哪些可以偏离,哪些不能。很好奇其他人如何处理这个问题。你是如何将复杂逻辑传递给代理的?
查看原文

相似文章

一位客户付钱让我把他们工具中的AI移除。

Reddit r/AI_Agents

一位开发者构建了一个基于LLM的工单路由工具,但支持团队不信任其黑箱决策。客户付费将LLM替换为简单的规则引擎,结果准确率更高、成本更低、用户信任度也更高。

代理规则必须存在于操作发生的地方

Reddit r/AI_Agents

本文主张,人工智能代理的安全规则应作为硬性工作流约束和权限来实现,而非仅依赖提示词指令。文章强调对于敏感或不可逆的操作,需要明确的检查、审批和日志记录。