@freeman1266: Spec + ReAct + Ralph:这三层架构,才是 Agent 长任务真正能跑通的工程基础。 很多人以为让 Agent "跑起来"就完了。 其实那只是开始。 模型停了,不代表任务完成。 做 Agent 长任务,你需要三层结构: 第…

X AI KOLs Timeline 新闻

摘要

提出Agent长任务的三层工程架构:Spec(任务定义)、ReAct(执行循环)、Ralph(外部完成判断),强调结构化可靠运行。

Spec + ReAct + Ralph:这三层架构,才是 Agent 长任务真正能跑通的工程基础。 很多人以为让 Agent "跑起来"就完了。 其实那只是开始。 模型停了,不代表任务完成。 做 Agent 长任务,你需要三层结构: 第一层:Spec——把任务拆清楚 没有清晰的任务定义,Agent 只会做到哪算哪。 Spec 的核心是把目标、验证条件、约束边界都写明白——不是写进 prompt,而是挂到 Session 上,让整个任务有一个持续存在的完成条件。 第二层:ReAct——让模型进入执行现场 ReAct 的循环是:思考 → 行动 → 观察 → 再思考。 Agent 才不是在"回答问题",而是在"做事"。 PlanAct 管规划,CodeAct 管代码行动,MultiAgent 管协作——但底层都跑在这个循环上。 第三层:Ralph——在外面套一层 LoopControl Ralph 是外部控制器,负责判断任务有没有真正完成。 模型觉得差不多,不代表任务完成。Ralph 持续检查:继续、暂停、完成,还是停下来等人确认。 三层缺一不可: · Spec 解决任务定义 · ReAct 解决执行循环 · Ralph 解决完成判断 Agent 工程不是"让 AI 多干几轮"。是把任务、执行、控制都结构化,让每一次运行都比上一次更可靠。
查看原文
查看缓存全文

缓存时间: 2026/06/02 15:44

Spec + ReAct + Ralph:这三层架构,才是 Agent 长任务真正能跑通的工程基础。

很多人以为让 Agent “跑起来“就完了。

其实那只是开始。

模型停了,不代表任务完成。

做 Agent 长任务,你需要三层结构:

第一层:Spec——把任务拆清楚 没有清晰的任务定义,Agent 只会做到哪算哪。 Spec 的核心是把目标、验证条件、约束边界都写明白——不是写进 prompt,而是挂到 Session 上,让整个任务有一个持续存在的完成条件。

第二层:ReAct——让模型进入执行现场 ReAct 的循环是:思考 → 行动 → 观察 → 再思考。 Agent 才不是在“回答问题“,而是在“做事“。 PlanAct 管规划,CodeAct 管代码行动,MultiAgent 管协作——但底层都跑在这个循环上。

第三层:Ralph——在外面套一层 LoopControl Ralph 是外部控制器,负责判断任务有没有真正完成。 模型觉得差不多,不代表任务完成。Ralph 持续检查:继续、暂停、完成,还是停下来等人确认。

三层缺一不可: · Spec 解决任务定义 · ReAct 解决执行循环 · Ralph 解决完成判断

Agent 工程不是“让 AI 多干几轮“。是把任务、执行、控制都结构化,让每一次运行都比上一次更可靠。

相似文章

@XAMTO_AI: 想自己从零搭一个生产级 Agent Harness?别做梦了,以为随便挑个框架就能收工的,基本全翻车了。 真相是这玩意儿压根不是"选框架"能摆平的事,它背后藏着15项你绕不开的硬核职责: 每一项都得做成能安装、能版本化、还能换语言跑的 w…

X AI KOLs Timeline

The article argues that production agent harnesses should not be monolithic frameworks but rather a stack of independent, replaceable workers connected by a shared trigger primitive, outlining 15 core responsibilities and how the iii engine implements this approach.

@yibie: 多 Agent 系统炒了一年,生产环境里真正活下来的只有三种模式。剩下的都在坟墓里。 这个结论不是我的。它来自三份今天同时浮出水面的证据——一份是 Cognition(Devin 背后的公司)工程负责人的内部复盘,一份是 Manning …

X AI KOLs Timeline

本文综合三份独立报告(Cognition 工程负责人的复盘、Manning 作者的行业全景报告、metaswarm 项目),指出生产环境中真正存活的多 Agent 系统只有三种模式:流水线、编排和生成-验证,而对等协作模式因隐式决策冲突和级联误差而失败。

@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821

X AI KOLs Timeline

文章拆解了2026年Agent框架的六条设计路线(LangGraph、OpenAI Agents SDK、CrewAI、Dify、厂商原生SDK、Pi),并提供了基于状态管理、流程复杂度、人机交互、模型灵活性等维度的选型建议,适合需要在生产环境中选择Agent框架的团队参考。

@elliotchen100: 表面上是 Claude Code 能自己生成 workflow,往深一层看,是 agent 产品的控制面在变化。 过去我们把复杂任务塞进一个长 context,期待模型自己记住目标、拆步骤、判断完成;现在这些东西开始外化成可执行的 har…

X AI KOLs Timeline

文章指出,Claude Code能自动生成workflow的背后,反映了AI agent产品的控制面正在从依赖长上下文记忆目标、拆解步骤,转向外化为可执行的harness,包括任务结构、权限边界、验证机制和停止条件等。