责怪模型无法修复你的工作流——关于AI智能体结构性约束的白皮书

Reddit r/artificial 工具

摘要

一份白皮书,识别了AI智能体工作流中的24种失效模式,并提出了一种包含三层约束、任务图和验证的结构性约束架构,以及一个基于Common Lisp的参考实现。

我一直在做一些别人可能会感兴趣的东西。目前还处于大量开发阶段,我边学边做。大多数AI智能体设置将模型视为更好的自动补全工具——粘贴提示词,获取输出,希望它是正确的。这对小任务有效。但当你想让智能体跨会话持续工作时,它就会崩溃:它们浏览规格说明,在完成60%时就宣布胜利,在噪音上消耗上下文,默默地解决歧义而不将其暴露出来,并且标记清单项为已完成但实际上并未完成。这些失败是可预测且可命名的——所以我给它们命了名。这是一份关于全栈智能体系统的白皮书和实施指南——从规划到在结构性约束下提升的整个过程。它记录了数月多智能体操作中出现的24种失效模式,并针对每种模式描述了实际预防它的方法:有些通过智能体无法跳过的机械门控,有些通过程序性技能,有些通过人工监督。该指南涵盖了如何构建规格说明、计划和验证,以使智能体工作以证据为导向而非以感觉为导向,如何将MCP能力表面用作结构性杠杆,以及这些失效模式如何适用于你使用的任何模型或供应商。白皮书还包括一个相关工作部分,将其置于新兴行业共识的背景下——CodeRabbit、Anthropic、Spotify、Cloudflare、OpenAI、Karpathy、Thoughtworks以及学术研究都独立得出了部分相同的结论。这里的不同之处在于集成的堆栈:一个映射到预防机制的失效分类法,一个三层约束架构,以及一个包含编排器、任务图、步骤验证、对抗性审查和模型分层的具体参考实现。白皮书:[https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/white-paper.md](https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/white-paper.md) 参考实现:[https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/docs/reference-implementation-guide.md](https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/docs/reference-implementation-guide.md) 实施指南:[https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/implementation-guide.md](https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/implementation-guide.md) 该方法是语言无关的。参考实现使用Common Lisp,但架构(编排器、监督器、MCP服务器、任务图、事件发射)并不假设任何特定的语言或领域。还有配套的规范用于适配企业工作流。
查看原文

相似文章

大多数 AI Agent 的失败是组织设计失败,而非模型失败

Reddit r/AI_Agents

文章认为,生产环境中 AI Agent 的失败往往归因于糟糕的组织设计和模糊的责任边界,而非模型本身的局限性。文章提出了一种成熟度模型,区分了 AI 助手、自动化流程和 AI 员工,以指导任务所有权的确立。