责怪模型无法修复你的工作流——关于AI智能体结构性约束的白皮书

Reddit r/artificial 2026/05/29 00:51 工具

ai-agent workflow structural-enforcement failure-modes architecture reference-implementation

摘要

一份白皮书，识别了AI智能体工作流中的24种失效模式，并提出了一种包含三层约束、任务图和验证的结构性约束架构，以及一个基于Common Lisp的参考实现。

我一直在做一些别人可能会感兴趣的东西。目前还处于大量开发阶段，我边学边做。大多数AI智能体设置将模型视为更好的自动补全工具——粘贴提示词，获取输出，希望它是正确的。这对小任务有效。但当你想让智能体跨会话持续工作时，它就会崩溃：它们浏览规格说明，在完成60%时就宣布胜利，在噪音上消耗上下文，默默地解决歧义而不将其暴露出来，并且标记清单项为已完成但实际上并未完成。这些失败是可预测且可命名的——所以我给它们命了名。这是一份关于全栈智能体系统的白皮书和实施指南——从规划到在结构性约束下提升的整个过程。它记录了数月多智能体操作中出现的24种失效模式，并针对每种模式描述了实际预防它的方法：有些通过智能体无法跳过的机械门控，有些通过程序性技能，有些通过人工监督。该指南涵盖了如何构建规格说明、计划和验证，以使智能体工作以证据为导向而非以感觉为导向，如何将MCP能力表面用作结构性杠杆，以及这些失效模式如何适用于你使用的任何模型或供应商。白皮书还包括一个相关工作部分，将其置于新兴行业共识的背景下——CodeRabbit、Anthropic、Spotify、Cloudflare、OpenAI、Karpathy、Thoughtworks以及学术研究都独立得出了部分相同的结论。这里的不同之处在于集成的堆栈：一个映射到预防机制的失效分类法，一个三层约束架构，以及一个包含编排器、任务图、步骤验证、对抗性审查和模型分层的具体参考实现。白皮书：[https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/white-paper.md](https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/white-paper.md) 参考实现：[https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/docs/reference-implementation-guide.md](https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/docs/reference-implementation-guide.md) 实施指南：[https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/implementation-guide.md](https://gitlab.com/naive-x/naive-artifact-coding/-/blob/main/implementation-guide.md) 该方法是语言无关的。参考实现使用Common Lisp，但架构（编排器、监督器、MCP服务器、任务图、事件发射）并不假设任何特定的语言或领域。还有配套的规范用于适配企业工作流。

查看原文

责怪模型无法修复你的工作流——关于AI智能体结构性约束的白皮书

相似文章

AI代理的失败方式鲜有人论及。以下是我亲眼所见。

AI 智能体开始暴露出大多数工作流程原本就已支离破碎的事实

我们的大部分“智能体”问题实际上是工作流/状态问题

我们在生产环境的 AI 智能体中加入了管控层——关于那些无人谈论的失效模式，我们学到了什么

大多数 AI Agent 的失败是组织设计失败，而非模型失败

提交意见反馈