@rohanpaul_ai: 来自剑桥大学、英伟达及其他顶尖实验室的新论文教会AI智能体和AI评判者共同改进，使任何一方都不会……

X AI KOLs Following 2026/06/29 05:04 论文

co-evolving self-improving ai-agents evaluators code-generation paper-writing reinforcement-learning cambridge nvidia

摘要

来自剑桥大学、英伟达及其他实验室的一篇新论文介绍了Red Queen Gödel机器，这是一种让AI智能体及其评估者共同进化以防止停滞的方法。该方法通过允许评判者在安全交接点改进来避免固定基准，从而在编程和论文写作任务中取得更好的性能。

来自剑桥大学、英伟达及其他顶尖实验室的新论文教会AI智能体和AI评判者共同改进，以便任何一方都不会陷入停滞。它将自我改进的AI从固定基准转向一个循环，其中执行评判的实体也可以变得更好。问题在于，大多数自我改进的智能体都是针对固定基准或固定评估者进行训练，因此得分可能会变得过时、过于简单或容易被操纵。论文的想法是让评估者也得到改进，但仅在安全交接点进行，这样每个训练阶段仍然有一个稳定的评判者。在每个阶段，智能体由当前冻结的评估者测试，而可能的更好评估者则针对保留的人类或客观答案单独测试。作者们在编程、论文写作、论文评审、证明写作和证明评分上尝试了该方法，其中一些任务有明确答案，另一些则需要学习判断。在编程方面，该系统击败了先前最好的自我改进编程智能体，同时使用的令牌数量减少了1.35倍到1.72倍，因为一个廉价的代码审核者添加了有用的反馈。在论文写作方面，与固定评估者基线相比，共同进化的写作者在评审小组中获得的平均接受率提高了约1.86倍。重点在于，更强大的AI系统可能需要更强大的评判者与之共同成长，因为固定测试可能不再提供有用的压力。 ---- 链接 – arxiv.org/abs/2606.26294 标题: "The Red Queen Gödel Machine: Co-Evolving Agents and Their Evaluators"

查看原文

查看缓存全文

缓存时间: 2026/06/29 10:34

来自剑桥大学、英伟达及其他顶级实验室的新论文，教AI智能体与AI评审者共同改进，避免任何一方陷入停滞。

它将自我改进AI从固定基准转向循环机制，让负责评判的一方也能持续进化。

问题在于大多数自我改进智能体都针对固定基准或固定评估器进行训练，导致得分可能变得陈旧、过于简单或容易被钻空子。

该论文的思路是让评估器也能改进，但仅在安全的交接点进行，使每轮训练阶段仍拥有稳定的评审者。

在每个阶段，智能体由当前冻结的评估器测试，同时潜在的更优评估器则针对预留的人类答案或客观答案进行独立测试。

作者在编程、论文写作、论文评审、证明写作和证明评分等任务上进行了实验——其中有些任务有明确答案，另一些则需要习得性判断。

在编程任务中，该系统以1.35到1.72倍更少的token消耗超越了此前最优的自我改进编程智能体，因为一个廉价的代码评审者提供了有用的反馈。

在论文写作任务中，与固定评估器基线的论文相比，共同进化的写手平均被评审专家组接受的几率提高了约1.86倍。

核心观点是更强的AI系统可能需要随着它们成长的更强评审者，因为固定测试可能不再能施加有效压力。

链接：arxiv.org/abs/2606.26294

标题：《红皇后格德尔机：智能体及其评估器的协同进化》

相似文章

@Phoenixyin13: 震撼！来自英伟达和剑桥大学等团队的这篇 Red Queen Gödel Machine 绝对是我近期认为最重要的 AI 论文之一。这次，论文直接针对自我改进 AI 的核心瓶颈：以前，评估器一旦固定不变，就会导致代理钻空子或者快速停滞不…

X AI KOLs Timeline

英伟达与剑桥大学等团队提出的Red Queen Gödel Machine论文，通过让代理和评估器共进化解决了递归自我改进的瓶颈，在代码、论文写作等任务上超越现有SOTA，为可控开放式AI进化提供了重要方法论。

@rohanpaul_ai: 来自剑桥大学、英伟达及其他顶尖实验室的新论文教会AI智能体和AI评判者共同改进，使任何一方都不会……

相似文章

红皇后哥德尔机：共同进化的智能体及其评估者

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2054201045346287766

@rohanpaul_ai: 精彩新论文来自Meta、CMU及其他实验室。表明编码代理通过制造自己的...来更快地提升。

@Mnilax：谷歌和斯坦福的工程师刚刚发布了一份39页的PDF，内容是关于什么真正让AI agent自我改进的。输入→输出…

提交意见反馈