@freeman1266: Spec + ReAct + Ralph:这三层架构,才是 Agent 长任务真正能跑通的工程基础。 很多人以为让 Agent "跑起来"就完了。 其实那只是开始。 模型停了,不代表任务完成。 做 Agent 长任务,你需要三层结构: 第…
摘要
提出Agent长任务的三层工程架构:Spec(任务定义)、ReAct(执行循环)、Ralph(外部完成判断),强调结构化可靠运行。
查看缓存全文
缓存时间: 2026/06/02 15:44
Spec + ReAct + Ralph:这三层架构,才是 Agent 长任务真正能跑通的工程基础。
很多人以为让 Agent “跑起来“就完了。
其实那只是开始。
模型停了,不代表任务完成。
做 Agent 长任务,你需要三层结构:
第一层:Spec——把任务拆清楚 没有清晰的任务定义,Agent 只会做到哪算哪。 Spec 的核心是把目标、验证条件、约束边界都写明白——不是写进 prompt,而是挂到 Session 上,让整个任务有一个持续存在的完成条件。
第二层:ReAct——让模型进入执行现场 ReAct 的循环是:思考 → 行动 → 观察 → 再思考。 Agent 才不是在“回答问题“,而是在“做事“。 PlanAct 管规划,CodeAct 管代码行动,MultiAgent 管协作——但底层都跑在这个循环上。
第三层:Ralph——在外面套一层 LoopControl Ralph 是外部控制器,负责判断任务有没有真正完成。 模型觉得差不多,不代表任务完成。Ralph 持续检查:继续、暂停、完成,还是停下来等人确认。
三层缺一不可: · Spec 解决任务定义 · ReAct 解决执行循环 · Ralph 解决完成判断
Agent 工程不是“让 AI 多干几轮“。是把任务、执行、控制都结构化,让每一次运行都比上一次更可靠。
相似文章
@XAMTO_AI: 想自己从零搭一个生产级 Agent Harness?别做梦了,以为随便挑个框架就能收工的,基本全翻车了。 真相是这玩意儿压根不是"选框架"能摆平的事,它背后藏着15项你绕不开的硬核职责: 每一项都得做成能安装、能版本化、还能换语言跑的 w…
The article argues that production agent harnesses should not be monolithic frameworks but rather a stack of independent, replaceable workers connected by a shared trigger primitive, outlining 15 core responsibilities and how the iii engine implements this approach.
@yibie: 多 Agent 系统炒了一年,生产环境里真正活下来的只有三种模式。剩下的都在坟墓里。 这个结论不是我的。它来自三份今天同时浮出水面的证据——一份是 Cognition(Devin 背后的公司)工程负责人的内部复盘,一份是 Manning …
本文综合三份独立报告(Cognition 工程负责人的复盘、Manning 作者的行业全景报告、metaswarm 项目),指出生产环境中真正存活的多 Agent 系统只有三种模式:流水线、编排和生成-验证,而对等协作模式因隐式决策冲突和级联误差而失败。
@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821
文章拆解了2026年Agent框架的六条设计路线(LangGraph、OpenAI Agents SDK、CrewAI、Dify、厂商原生SDK、Pi),并提供了基于状态管理、流程复杂度、人机交互、模型灵活性等维度的选型建议,适合需要在生产环境中选择Agent框架的团队参考。
@elliotchen100: 表面上是 Claude Code 能自己生成 workflow,往深一层看,是 agent 产品的控制面在变化。 过去我们把复杂任务塞进一个长 context,期待模型自己记住目标、拆步骤、判断完成;现在这些东西开始外化成可执行的 har…
文章指出,Claude Code能自动生成workflow的背后,反映了AI agent产品的控制面正在从依赖长上下文记忆目标、拆解步骤,转向外化为可执行的harness,包括任务结构、权限边界、验证机制和停止条件等。
@FeitengLi: 动手搭了一个 ReAct agent 系统:围绕 LLM 做 agent 系统 傍晚散步时在想:如何训练 LLM 的 agentic 能力、数据准备、模型训练、agent 轨迹 action 构造 RL 训练,再想 Claude 在过去一…
作者分享了搭建 ReAct agent 系统的经验,并介绍了智谱 AI 发布的 GLM-5 技术报告,该模型在 agentic、推理和编码方面取得了突破。