@AYi_AInotes: 说个反常识的判断， 80% 的 Agent 生产崩溃，跟模型智商没半毛钱关系，基本都死在上下文溢出、工具调错、子代理失控上， 2026 年真正的分水岭在 Harness 和 Loop，不是模型啊，兄弟@wizardly_ai 这篇工程…

X AI KOLs Timeline 2026/06/25 10:51 新闻

agent engineering context-window tool-calling harness loop ai-engineering

摘要

这篇文章指出80%的AI Agent生产崩溃并非模型智商问题，而是由上下文溢出、工具调错、子代理失控引起。作者强调2026年的分水岭在于Harness（办公室制度、安保系统）和Loop（自动循环机制），而非模型本身。

说个反常识的判断， 80% 的 Agent 生产崩溃，跟模型智商没半毛钱关系，基本都死在上下文溢出、工具调错、子代理失控上， 2026 年真正的分水岭在 Harness 和 Loop，不是模型啊，兄弟@wizardly_ai 这篇工程笔记写得很肝，但把这件事拆透了。 Harness 是什么，是给 Agent 配的办公室制度、安保系统和质检流程，让它不至于一激动就把公司搞砸。独立验证节点是命脉，分层记忆不是全塞进 prompt，延迟绑定工具只给目录、用的时候再拉完整 schema。 Loop 是什么？是让它自己发现该干什么、分派任务、验证结果、记录状态，你不再是坐在电脑前一遍遍打 prompt 的人，你变成设计循环的人。以前我们学怎么写 Prompt，后来学怎么编排 Agent，现在学怎么给 Agent 加运行时，下一步是学怎么让运行时自己跑。 Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny，现在写的是循环，不是 prompt。最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效，好模型配差循环出昂贵垃圾，普通模型配好循环加验证反而能稳定出货。模型是可替换的引擎， Harness 是让你不翻车的底盘和安全系统， Loop 是让你不用 24 小时盯着方向盘的自动驾驶。这三样加起来，才是能积累、能传承的 Agent 工程能力。这才是 2026 年真正该卷的东西吧 hhh

查看原文

查看缓存全文

缓存时间: 2026/06/25 15:25

说个反常识的判断， 80% 的 Agent 生产崩溃，跟模型智商没半毛钱关系，基本都死在上下文溢出、工具调错、子代理失控上， 2026 年真正的分水岭在 Harness 和 Loop，不是模型啊，

兄弟@wizardly_ai 这篇工程笔记写得很肝，但把这件事拆透了。 Harness 是什么，是给 Agent 配的办公室制度、安保系统和质检流程，让它不至于一激动就把公司搞砸。

独立验证节点是命脉，分层记忆不是全塞进 prompt，延迟绑定工具只给目录、用的时候再拉完整 schema。

Loop 是什么？是让它自己发现该干什么、分派任务、验证结果、记录状态，你不再是坐在电脑前一遍遍打 prompt 的人，你变成设计循环的人。

以前我们学怎么写 Prompt，后来学怎么编排 Agent，现在学怎么给 Agent 加运行时，下一步是学怎么让运行时自己跑。

Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny，现在写的是循环，不是 prompt。

最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效，好模型配差循环出昂贵垃圾，普通模型配好循环加验证反而能稳定出货。

模型是可替换的引擎， Harness 是让你不翻车的底盘和安全系统， Loop 是让你不用 24 小时盯着方向盘的自动驾驶。这三样加起来，才是能积累、能传承的 Agent 工程能力。这才是 2026 年真正该卷的东西吧 hhh

相似文章

@yibie: 多 Agent 系统炒了一年，生产环境里真正活下来的只有三种模式。剩下的都在坟墓里。这个结论不是我的。它来自三份今天同时浮出水面的证据——一份是 Cognition（Devin 背后的公司）工程负责人的内部复盘，一份是 Manning …

X AI KOLs Timeline

本文综合三份独立报告（Cognition 工程负责人的复盘、Manning 作者的行业全景报告、metaswarm 项目），指出生产环境中真正存活的多 Agent 系统只有三种模式：流水线、编排和生成-验证，而对等协作模式因隐式决策冲突和级联误差而失败。

@ba_niu80557: https://x.com/ba_niu80557/status/2068751230667755859

X AI KOLs Timeline

文章探讨了AI模型不断强大如何淘汰那些技能可以被写进提示词的人，强调真正不可替代的价值在于难以编码的默会知识、物理世界的实际操作以及人与人之间的信任关系。作者通过朋友从咨询顾问转型为硬件集成者的例子，说明主动让出易被AI替代的环节、深耕AI触及不到的领域，才能在技术浪潮中生存和发展。

你的代理失败不是因为模型，而是因为没人构建一个停止按钮

Reddit r/AI_Agents

文章认为，AI代理在生产中的主要失败点并非模型本身，而是缺乏基础设施，如停止按钮、账单监控以及工具调用的可追溯性。

@wsl8297: 用 AI Agent 跑复杂任务，最难受的往往不是模型不够强，而是对话一变长，上下文就开始爆仓。你还得一遍遍补背景、重讲流程，再加上工具调用吐出来的冗余日志，Token 像开了口子一样往外流。最近看到腾讯开源的 TencentDB A…

X AI KOLs Timeline

腾讯开源了 TencentDB Agent Memory，通过分层记忆管理（符号化短期记忆+分层长期记忆）解决AI Agent长对话上下文爆仓问题，实测Token消耗最高降低61%，任务通过率提升超50%。

@Smartpigai: https://x.com/Smartpigai/status/2064209609896968679

X AI KOLs Timeline

本文探讨了在Agent时代，Loop Engineering（循环工程）比Prompt Engineering（提示工程）更重要的观点。作者认为，AI Agent的核心能力不在于模型本身，而在于围绕模型构建的反馈循环系统，这决定了Agent能否持续改进和接近正确答案。

相似文章

@ba_niu80557: https://x.com/ba_niu80557/status/2068751230667755859

你的代理失败不是因为模型，而是因为没人构建一个停止按钮

@Smartpigai: https://x.com/Smartpigai/status/2064209609896968679

提交意见反馈