@freeman1266: Spec + ReAct + Ralph：这三层架构，才是 Agent 长任务真正能跑通的工程基础。很多人以为让 Agent "跑起来"就完了。其实那只是开始。模型停了，不代表任务完成。做 Agent 长任务，你需要三层结构：第…

X AI KOLs Timeline 2026/06/02 07:31 新闻

agent architecture spec react ralph long-task engineering

摘要

提出Agent长任务的三层工程架构：Spec（任务定义）、ReAct（执行循环）、Ralph（外部完成判断），强调结构化可靠运行。

Spec + ReAct + Ralph：这三层架构，才是 Agent 长任务真正能跑通的工程基础。很多人以为让 Agent "跑起来"就完了。其实那只是开始。模型停了，不代表任务完成。做 Agent 长任务，你需要三层结构：第一层：Spec——把任务拆清楚没有清晰的任务定义，Agent 只会做到哪算哪。 Spec 的核心是把目标、验证条件、约束边界都写明白——不是写进 prompt，而是挂到 Session 上，让整个任务有一个持续存在的完成条件。第二层：ReAct——让模型进入执行现场 ReAct 的循环是：思考 → 行动 → 观察 → 再思考。 Agent 才不是在"回答问题"，而是在"做事"。 PlanAct 管规划，CodeAct 管代码行动，MultiAgent 管协作——但底层都跑在这个循环上。第三层：Ralph——在外面套一层 LoopControl Ralph 是外部控制器，负责判断任务有没有真正完成。模型觉得差不多，不代表任务完成。Ralph 持续检查：继续、暂停、完成，还是停下来等人确认。三层缺一不可： · Spec 解决任务定义 · ReAct 解决执行循环 · Ralph 解决完成判断 Agent 工程不是"让 AI 多干几轮"。是把任务、执行、控制都结构化，让每一次运行都比上一次更可靠。

查看原文

查看缓存全文

缓存时间: 2026/06/02 15:44

Spec + ReAct + Ralph：这三层架构，才是 Agent 长任务真正能跑通的工程基础。

很多人以为让 Agent “跑起来“就完了。

其实那只是开始。

模型停了，不代表任务完成。

做 Agent 长任务，你需要三层结构：

第一层：Spec——把任务拆清楚没有清晰的任务定义，Agent 只会做到哪算哪。 Spec 的核心是把目标、验证条件、约束边界都写明白——不是写进 prompt，而是挂到 Session 上，让整个任务有一个持续存在的完成条件。

第二层：ReAct——让模型进入执行现场 ReAct 的循环是：思考 → 行动 → 观察 → 再思考。 Agent 才不是在“回答问题“，而是在“做事“。 PlanAct 管规划，CodeAct 管代码行动，MultiAgent 管协作——但底层都跑在这个循环上。

第三层：Ralph——在外面套一层 LoopControl Ralph 是外部控制器，负责判断任务有没有真正完成。模型觉得差不多，不代表任务完成。Ralph 持续检查：继续、暂停、完成，还是停下来等人确认。

三层缺一不可： · Spec 解决任务定义 · ReAct 解决执行循环 · Ralph 解决完成判断

Agent 工程不是“让 AI 多干几轮“。是把任务、执行、控制都结构化，让每一次运行都比上一次更可靠。

相似文章

@XAMTO_AI: 想自己从零搭一个生产级 Agent Harness？别做梦了，以为随便挑个框架就能收工的，基本全翻车了。真相是这玩意儿压根不是"选框架"能摆平的事，它背后藏着15项你绕不开的硬核职责：每一项都得做成能安装、能版本化、还能换语言跑的 w…

X AI KOLs Timeline

The article argues that production agent harnesses should not be monolithic frameworks but rather a stack of independent, replaceable workers connected by a shared trigger primitive, outlining 15 core responsibilities and how the iii engine implements this approach.

@yibie: 多 Agent 系统炒了一年，生产环境里真正活下来的只有三种模式。剩下的都在坟墓里。这个结论不是我的。它来自三份今天同时浮出水面的证据——一份是 Cognition（Devin 背后的公司）工程负责人的内部复盘，一份是 Manning …

X AI KOLs Timeline

本文综合三份独立报告（Cognition 工程负责人的复盘、Manning 作者的行业全景报告、metaswarm 项目），指出生产环境中真正存活的多 Agent 系统只有三种模式：流水线、编排和生成-验证，而对等协作模式因隐式决策冲突和级联误差而失败。

@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821

X AI KOLs Timeline

文章拆解了2026年Agent框架的六条设计路线（LangGraph、OpenAI Agents SDK、CrewAI、Dify、厂商原生SDK、Pi），并提供了基于状态管理、流程复杂度、人机交互、模型灵活性等维度的选型建议，适合需要在生产环境中选择Agent框架的团队参考。

@elliotchen100: 表面上是 Claude Code 能自己生成 workflow，往深一层看，是 agent 产品的控制面在变化。过去我们把复杂任务塞进一个长 context，期待模型自己记住目标、拆步骤、判断完成；现在这些东西开始外化成可执行的 har…

X AI KOLs Timeline

文章指出，Claude Code能自动生成workflow的背后，反映了AI agent产品的控制面正在从依赖长上下文记忆目标、拆解步骤，转向外化为可执行的harness，包括任务结构、权限边界、验证机制和停止条件等。

@FeitengLi: 动手搭了一个 ReAct agent 系统：围绕 LLM 做 agent 系统傍晚散步时在想：如何训练 LLM 的 agentic 能力、数据准备、模型训练、agent 轨迹 action 构造 RL 训练，再想 Claude 在过去一…

X AI KOLs Following

作者分享了搭建 ReAct agent 系统的经验，并介绍了智谱 AI 发布的 GLM-5 技术报告，该模型在 agentic、推理和编码方面取得了突破。

相似文章

@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821

@elliotchen100: 表面上是 Claude Code 能自己生成 workflow，往深一层看，是 agent 产品的控制面在变化。 过去我们把复杂任务塞进一个长 context，期待模型自己记住目标、拆步骤、判断完成；现在这些东西开始外化成可执行的 har…

@FeitengLi: 动手搭了一个 ReAct agent 系统：围绕 LLM 做 agent 系统 傍晚散步时在想：如何训练 LLM 的 agentic 能力、数据准备、模型训练、agent 轨迹 action 构造 RL 训练，再想 Claude 在过去一…

提交意见反馈

@elliotchen100: 表面上是 Claude Code 能自己生成 workflow，往深一层看，是 agent 产品的控制面在变化。过去我们把复杂任务塞进一个长 context，期待模型自己记住目标、拆步骤、判断完成；现在这些东西开始外化成可执行的 har…

@FeitengLi: 动手搭了一个 ReAct agent 系统：围绕 LLM 做 agent 系统傍晚散步时在想：如何训练 LLM 的 agentic 能力、数据准备、模型训练、agent 轨迹 action 构造 RL 训练，再想 Claude 在过去一…