co-evolution

标签

Cards List
#co-evolution

@Phoenixyin13: 震撼!来自英伟达和剑桥大学等团队的这篇 Red Queen Gödel Machine 绝对是我近期认为最重要的 AI 论文之一。 这次,论文直接针对自我改进 AI 的核心瓶颈: 以前,评估器一旦固定不变,就会导致代理钻空子或者快速停滞不…

X AI KOLs Timeline · 19小时前 缓存

英伟达与剑桥大学等团队提出的Red Queen Gödel Machine论文,通过让代理和评估器共进化解决了递归自我改进的瓶颈,在代码、论文写作等任务上超越现有SOTA,为可控开放式AI进化提供了重要方法论。

0 人收藏 0 人点赞
#co-evolution

红皇后哥德尔机:共同进化的智能体及其评估者

arXiv cs.LG · 2天前 缓存

本文介绍了红皇后哥德尔机(RQGM),这是一个在非平稳效用下进行递归自我改进的进化框架,其中智能体和评估者共同进化,提高了在编程任务、科学写作和奥林匹克级证明评分方面的性能。

0 人收藏 0 人点赞
#co-evolution

@hanakoxbt: 麻省理工学院团队刚刚发布了一份24页的PDF,关于Claude Code代理的"自我进化技能"。Anthropic自己的技能创造者…

X AI KOLs Timeline · 3天前 缓存

MIT团队发布了一篇关于Claude Code代理自我进化技能的论文,通过生成-测试-验证-协同进化框架,实现了71.1%的通过率,比Anthropic的技能创造者高出37个百分点。

0 人收藏 0 人点赞
#co-evolution

人类的理解力 *仍然* 比以往任何时候都更需要

Reddit r/ArtificialInteligence · 3天前

一篇评论,强调尽管AI取得了进步,但人类的理解力对于安全和人道的部署仍然至关重要,敦促用户验证AI的输出并以尊重对待AI。

0 人收藏 0 人点赞
#co-evolution

合成反适应:人机协同进化原理

arXiv cs.AI · 2026-06-16 缓存

引入了合成反适应的概念,即人类与AI系统通过相互适应对方的策略而共同进化,并通过围棋、社交互动和地缘政治模拟等实例加以说明。

0 人收藏 0 人点赞
#co-evolution

超越静态评估:面向对抗博弈的LLM驱动策略演化中的共演化机制

arXiv cs.AI · 2026-06-10 缓存

本文提出了三种面向LLM驱动的对抗多智能体博弈代码演化的共演化机制(评估器共演化、分层深度评估和弱点压力),在MCTF 2026海上夺旗任务中取得了最先进的结果。

0 人收藏 0 人点赞
#co-evolution

EvoTrainer:面向自主智能体强化学习的LLM策略与训练框架协同进化

arXiv cs.AI · 2026-06-03 缓存

EvoTrainer提出了一种自主训练框架,通过经验反馈协同进化LLM策略与训练框架,在数学推理、代码生成以及长期软件工程任务上超越了人工设计的强化学习基线。

0 人收藏 0 人点赞
#co-evolution

基于LLM的双组件耦合组合优化协同进化自动启发式设计

arXiv cs.AI · 2026-06-02 缓存

提出CoEvo-AHD,一种基于LLM的双种群协同进化框架,用于双组件耦合组合优化问题的自动启发式设计。它利用LLM协同进化路径和选择算子,通过合作评估和联合交叉来发现针对TTP和TPP等问题的互补启发式。

0 人收藏 0 人点赞
#co-evolution

HarnessForge: 联合执行框架与策略演化用于自适应智能体系统

Hugging Face Daily Papers · 2026-06-01 缓存

HarnessForge 提出一种用于演化LLM智能体系统的元自适应框架,通过联合优化执行框架与推理策略,在五个基准测试上对Qwen3骨干模型实现持续改进。

0 人收藏 0 人点赞
#co-evolution

SCOPE:通过共同进化策略进行开放式任务的自我对弈

Hugging Face Daily Papers · 2026-05-29 缓存

SCOPE是一个用于开放式任务的自我对弈框架,它共同进化挑战者(Challenger)和求解器(Solver)策略,在没有外部监督的情况下,在基准测试上取得了高达+10.4分的提升。

0 人收藏 0 人点赞
#co-evolution

SEAL: 智能体与学习环境的协同共演化

arXiv cs.CL · 2026-05-26 缓存

SEAL提出了一个闭环框架,用于联合演化LLM智能体及其训练环境,利用诊断引导的标签对齐双方。仅用400个训练样本,它就在多轮工具使用任务上取得了显著提升,表现出更好的鲁棒性和分布外迁移能力。

0 人收藏 0 人点赞
#co-evolution

SEAL: 智能体与学习环境的协同共进化

Hugging Face Daily Papers · 2026-05-23 缓存

SEAL 是一个用于交互式工具使用智能体的闭环共进化框架,通过利用在线策略轨迹和回合级诊断同步策略与环境更新,解决了智能体-环境不匹配问题。

0 人收藏 0 人点赞
#co-evolution

MetaAgent-X:通过端到端强化学习突破自动多智能体系统的天花板

arXiv cs.AI · 2026-05-15 缓存

MetaAgent-X引入了一个端到端的强化学习框架,联合优化自动多智能体系统的设计与执行,克服了冻结执行器的天花板,并在现有基线基础上实现了高达21.7%的性能提升。

0 人收藏 0 人点赞
#co-evolution

RoboEvolve:在有限数据下实现机器人操作的计划器与模拟器协同进化

Hugging Face Daily Papers · 2026-05-13 缓存

RoboEvolve是一个框架,它协同进化VLM规划器和VGM模拟器用于机器人操作,仅用500张无标签种子图像就实现了数据效率以及鲁棒的持续学习。

0 人收藏 0 人点赞
#co-evolution

CoCoDA:用于工具增强型智能体的协同演化组合式 DAG

arXiv cs.AI · 2026-05-12 缓存

本文介绍了 CoCoDA,这是一个利用协同演化的组合式有向无环图(DAG)来管理增强型智能体工具库的框架。该框架使小型语言模型能够高效地检索和组合工具,从而使 8B 模型在推理基准测试上的性能能够匹敌甚至超越 32B 模型。

0 人收藏 0 人点赞
#co-evolution

GAMBIT:用于多智能体 LLM 集体中对抗鲁棒性评估的三模式基准

arXiv cs.CL · 2026-05-12 缓存

本文介绍了 GAMBIT,这是一个用于评估多智能体 LLM 集体中对抗鲁棒性的基准测试。该基准包含自适应冒名顶替者(imposter)和重新校准(recalibration)模式,旨在解决现有浅层评估方法的局限性。

0 人收藏 0 人点赞
#co-evolution

G-Zero:从零数据开始的无界生成自博弈方法

Hugging Face Daily Papers · 2026-05-11 缓存

本文介绍了 G-Zero,这是一个无需验证器的框架,通过基于内在奖励和提示引导的协同进化训练,实现大型语言模型的自主自我改进。旨在通过从内部分布动态中推导监督信号,克服代理 LLM 评判者在无界任务中的局限性。

0 人收藏 0 人点赞
#co-evolution

TacoMAS:基于大语言模型的多智能体系统中拓扑与能力的测试时共演化

Hugging Face Daily Papers · 2026-05-10 缓存

本文介绍了 TacoMAS,这是一个用于大语言模型驱动的多智能体系统中智能体能力与通信拓扑测试时共演化的框架。研究表明,与现有基线相比,联合调整快速能力环和慢速拓扑环能够提升性能并增强稳定性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈