@Mnilax:谷歌和斯坦福的工程师刚刚发布了一份39页的PDF,内容是关于什么真正让AI agent自我改进的。输入→输出…
摘要
谷歌和斯坦福的工程师发布的一份39页论文分析了使AI agent通过反馈循环自我改进的关键因素,并指出只有9%的agent实际运行了真正的循环。
查看缓存全文
缓存时间: 2026/06/25 11:18
Google和斯坦福的工程师们刚刚发布了一份39页的PDF文档,揭示了AI代理究竟如何实现自我改进。
输入 → 输出 → 反馈 → 更新 → 重复
文档开篇就给出了一个数字:只有9%的代理能够运行真正的循环。
其他91%的代理,实际上都是靠人类手动输入下一个提示。
他们的观点:循环不是一种氛围,而是三个隐藏的选择
- 起始工件(starting artifact)
- 信用跨度(credit horizon)
- 经验批处理(experience batching)
我花了几周时间才把这三点搞对。
现在,我的循环在我睡觉时自动运行,并重写自己的技能文件,这样它就不会再问我第二遍。
论文解释了为什么91%的循环静悄悄地死掉。而本文,就是那个没有死掉的循环。
相似文章
@dair_ai: 关于自我改进智能体的优秀论文:
本周一篇重要的AI论文探讨了自我改进智能体是否真正发现新知识,还是仅仅在重新混合现有信息。
@DataScienceDojo:大多数AI代理一遍又一遍地在相同任务上失败。不是因为模型不好,而是因为没人告诉它该如何工作……
一篇新论文介绍了Self-Harness,一种让AI代理通过分析自身失败、生成修复方案并测试它们来自我改进的方法,从而将通过率提高了最多21个百分点。
@omarsar0:关于自我改进智能体的优秀论文。为什么?我们需要更深入地思考 AI 智能体系统设计。该协议规范……
一篇论文提出了一种自我改进 AI 智能体的协议框架,支持可审计的改进提案、评估与回滚。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2054201045346287766
文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究,具体涉及达尔文-哥德尔机器(Darwin-Gödel Machine)和超智能体(Hyperagents),它们能够自主重写自身代码和基础设施以提升性能,且无需人工干预。
@zodchiii:斯坦福团队刚刚发布了16页PDF《如何构建AI代理》——结构比提示词更重要,远超你的想象……
斯坦福团队发布了一份16页的PDF,阐述如何构建AI代理,强调结构化上下文优于一次性提示,并提出了“构建→反思→精选→复用”的方法,实证结果支持其有效性。