AI代理缺失的一层不是自主性,而是结构化意图
摘要
SR8是一种工具,它能将人类或机器的原始意图编译成AI系统的结构化制品规范,通过在执行前形式化上下文、约束和成功标准,弥合了模糊请求与高质量输出之间的鸿沟。
AI工具正变得越来越强大,但大多数AI工作仍然在同一个环节出错。问题不出在模型,而在于人的意图与系统实际构建之间的交接。一位创始人说:“把这个想法变成产品简报。”一个团队说:“审计这个工作流程。”一位设计师说:“让这场营销活动更犀利。”一位开发者说:“修复这个功能。”一位客户说:“给我建一个能真正代表公司的网站。”请求听起来很简单,但真正的工作潜藏在其下。目标是什么?上下文是什么?真相来源是什么?什么算好?应该避免什么?哪些约束重要?哪些已经决定?什么会导致输出失败?最终制品应携带哪些证明?大多数AI工作流程跳过了这一层。它们接受一个粗略的请求,直接传递给模型,并希望输出足够接近。这对随意任务有效,但当制品至关重要时,就会失败。这就是我构建SR8所要解决的差距。SR8代表Intent To Apex Artefact Compiler。通俗地说:SR8将杂乱的人类或机器意图转化为可构建、检查、修复、重用和追踪的结构化工作对象。它不是提示库,也不是规划模板,更不是一次性工作流。它是一个意图编译器。区别很重要。提示是向模型请求某物。计划是描述应该发生什么。编译器是将原始输入转化为另一系统可执行的结构化形式。这就是SR8为工作所做的。它提取原始意图,转化为制品规范。该规范定义:
- 正在构建什么
- 为什么构建
- 为谁构建
- 哪些源材料重要
- 允许哪些假设
- 哪些约束是硬性的
- 哪些约束是灵活的
- 需要什么输出格式
- 存在哪些失败条件
- 必须通过哪些验收门槛
- 发布前需要审计什么
- 应该留下什么证明
这改变了输出的质量,因为AI不再根据模糊请求猜测,而是针对结构化目标执行。SR8的循环是:摄取 → 结构化 → 编译 → 构建 → 审计 → 修复 → 发布 → 收据。摄取原始材料。可以是一个句子、一份凌乱的简报、一份转录稿、一条客户笔记、一次失败输出、一条系统日志、一个工作流状态、一个Markdown文件、一个JSON对象或一条模型响应。结构化意图。提取目标、上下文、约束、缺失部分、风险、制品类型和成功标准。编译成可用的规范。不是一个松散的想法,而是一个恰当的工作对象。根据该规范构建。审计结果。检查缺失、薄弱、矛盾、泛泛、无依据或偏离目标的内容。修复制品。不满足于首次生成。只有当输出符合合同时才发布。然后留下收据:什么进来了、什么改变了、什么通过了、什么失败了、什么发布了。这就是SR8的核心。这之所以重要,原因很简单:AI工作正从聊天输出转向操作性制品。企业需要的不是“一个回复”,而是登录页面、审计报告、销售系统、工作流、报告、产品规范、营销活动、法律审查流程、财务驾驶舱、潜在客户丰富系统、受控代理或证明文档。这些是制品。制品需要结构。制品需要标准。制品需要版本控制。制品需要修复。制品需要可追溯性。这就是SR8所围绕的市场空白。大多数团队仍将AI视为更智能的文本框。他们提出更好的问题、保存更好的提示、堆叠工具。这有所帮助,但并未解决更深层的问题。更深层的问题是:在执行之前,意图本身没有被形式化。当意图模糊时,输出变得泛泛。当上下文不稳定时,输出变得肤浅。当约束缺失时,输出偏离方向。当成功标准不明确时,输出看似完成,实则在实践中失败。当没有收据时,没人能解释发生了什么。SR8解决了这一层问题。它使意图结构化到足以经受执行。这适用于人类意图和机器意图。人类意图是杂乱的,因为人们以碎片、压力、假设、捷径、矛盾和缺失上下文的方式说话。机器意图是杂乱的,因为系统产生部分状态:日志、跟踪、工具调用、错误、重试、差异、草稿、输出、批准和中间制品。SR8将两者都视为源材料。它提取关键部分,组织、编译、验证并转化为可用的东西。这就是为什么我不称此为提示工程。提示工程是关于从模型获得更好的响应。SR8则是将意图转化为持久的工作单元。制品成为单元,而不是聊天、提示或模型的首次响应。制品。一旦制品结构化,它就可以被重用。一旦可重用,就可以改进。一旦改进,就可以审计。一旦审计,就可以信任。一旦信任,就可以成为基础设施。这是我看到的更大转变。AI工作的下一阶段不仅仅是更好的模型,而是意图与执行之间更好的转换。SR8是我对这一转变的回答。我已在业务审计、网站蓝图、代理规范、外展系统、PDF报告、潜在客户丰富工作流、视觉生成链、治理工作流、接收系统和运营协议中使用了这一模式。同样的模式一直成立:弱意图产生弱制品。非结构化意图产生泛泛制品。未验证意图产生脆弱制品。无收据的工作会消失。结构化意图产生更好的执行。这就是SR8的论点。在模型构建之前,意图先被结构化。在制品发布之前,输出先被检查。在工作被信任之前,收据已经存在。常见问题:这只是提示工程吗?不。提示是请求。SR8是在执行前编译工作对象。它与代理有何不同?代理采取行动。SR8结构化了代理所作用的对象。SR8实际产生什么?结构化制品规范、执行合约、审计路径、修复循环和收据追踪。它只适用于人类请求吗?不。它可以结构化人类意图和机器意图:简报、命令、转录稿、日志、跟踪、失败输出、工具结果、工作流状态和模型响应。它是特定领域的吗?不。我已在业务审计、网站蓝图、代理规范、外展系统、PDF报告、潜在客户丰富工作流、视觉链、治理工作流、接收系统和运营协议中使用了同一模式。它是一个产品、一个框架还是一种语言?它正成为三者:一个编译器模式、一个结构化制品层,以及一个更大的受控执行系统的基础。核心主张很简单:AI工作不应始于生成,而应始于结构化意图。这就是SR8的构建目的。如果这触动到你一直有感受却无法言说的东西,请提出尖锐的问题。我将从系统而非理论角度回答。
相似文章
@sairahul1: https://x.com/sairahul1/status/2058464422306443766
一份关于AI智能体的全面指南,涵盖基础知识、ReAct循环、任务分解、上下文工程以及自主性光谱,面向初学者和构建生产系统的人员。
大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子
作者分享了他为识别和评估公司内 AI 用例而构建的智能体研究系统的实际分解。该系统使用六个智能体进行发现、评估和上下文提取,强调人在决策环中,而非完全自主。
AI代理是否正在成为新的软件抽象层?
作者探讨了AI代理如何作为现有软件的新的抽象层,将用户交互从导航用户界面转向描述结果,从而减少将意图转化为可执行任务时的摩擦。
我认为AI代理将需要一个操作层
作者认为,随着AI代理变得越来越自主,需要一个治理层来实现控制、可观测性和可审计性,并介绍了Bendex Arc作为解决方案,其组件包括Arc Gate、Arc Replay、Arc Approve和Arc Memory。
有没有人也觉得AI代理在事情变得复杂之前都表现得很惊艳?
对AI代理令人印象深刻的演示和可靠的实际执行之间差距的反思,认为当前代理擅长结构化任务但在不可预测条件下会失败,并指出近期AI角色将主要集中于带人类监督的窄范围自动化。