超越个体智能:基于LLM的多智能体系统中的协作、故障归因与自我进化综述

Hugging Face Daily Papers 论文

摘要

本综述论文对基于LLM的多智能体系统进行了统一回顾,聚焦于协作、故障归因和自我进化,通过LIFE框架识别开放挑战,并提出跨阶段的研究议程。

基于LLM的自主智能体在推理、规划和工具使用方面展现了强大的能力,但在需要跨角色、工具和环境持续协调的任务中仍存在局限。多智能体系统通过专业智能体之间的结构化协作来解决这一问题,但更紧密的协调也放大了较少被探讨的风险:错误可能在智能体之间以及交互轮次中传播,导致难以诊断且很少转化为结构性自我改进的故障。现有综述分别涵盖了个体智能体能力、多智能体协作或智能体自我进化,但未考察其中存在的因果依赖关系。本综述围绕四个因果关联的阶段(我们称之为LIFE进程:奠定能力基础、通过协作整合智能体、通过归因发现故障、通过自主自我改进进化)进行了统一回顾。针对每个阶段,我们提供了系统化的分类法,并正式刻画了相邻阶段之间的依赖关系,揭示每个阶段如何既依赖于又约束下一个阶段。除综合现有工作外,我们识别了阶段边界上的开放挑战,并提出了面向闭环多智能体系统的跨阶段研究议程,这类系统能够持续诊断故障、重组结构并优化智能体行为,将当前协调框架向更自组织的集体智能形式扩展。通过连接这些先前碎片化的研究线索,本综述旨在提供系统化的参考以及通向自主、自我改进的多智能体智能的概念路线图。
查看原文
查看缓存全文

缓存时间: 2026/05/15 04:23

论文页面 - 超越个体智能:在基于LLM的多智能体系统中探索协作、失败归因与自我演化

来源:https://huggingface.co/papers/2605.14892 发布于5月14日

·

https://huggingface.co/JamesMile JieMa (https://huggingface.co/JamesMile) 于5月15日提交

作者:

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

摘要

多智能体系统在持续协调和错误传播方面面临挑战,需要采用集成方法,使其能够在结构化协作阶段进行持续诊断、重组和行为优化。

基于LLM的自主智能体在推理、规划和工具使用方面展现出强大能力,但当任务需要在角色、工具和环境之间进行持续协调时,其能力仍然有限。多智能体系统通过专业智能体之间的结构化协作来解决这一问题,但更紧密的协调也放大了一个尚未充分探索的风险:错误可以在智能体之间以及交互轮次中传播,产生难以诊断的失败,且这些失败很少能转化为结构化的自我改进。现有综述分别涵盖了个体智能体能力、多智能体协作或智能体自我演化,而未能考察它们之间的因果依赖关系。本综述提供了一个统一的回顾,围绕四个因果关联的阶段展开,我们将其称为LIFE进程:奠定能力基础(Lay the capability foundation)、通过协作整合智能体(Integrate agents through collaboration)、通过归因发现故障(Find faults through attribution)、通过自主自我改进进行演化(Evolve through autonomous self-improvement)。针对每个阶段,我们提供了系统的分类,并形式化地描述了相邻阶段之间的依赖关系,揭示每个阶段如何既依赖于又约束着下一阶段。除了综合现有工作之外,我们还在阶段边界处识别出开放挑战,并提出了一个跨阶段的研究议程,旨在构建能够持续诊断失败、重组结构并优化智能体行为的闭环多智能体系统,将当前的协调框架扩展到更具自我组织形态的集体智能。通过桥接这些先前分散的研究线索,本综述旨在提供一个系统性参考以及一条通往自主、自我改进的多智能体智能的概念路线图。

查看arXiv页面 查看PDF GitHub4 (https://github.com/mira-ai-lab/awesome-mas-life) 添加到收藏

引用此论文的模型0

没有链接此论文的模型

请在模型 README.md 中引用 arxiv.org/abs/2605.14892,以在此页面建立链接。

引用此论文的数据集0

没有链接此论文的数据集

请在数据 README.md 中引用 arxiv.org/abs/2605.14892,以在此页面建立链接。

引用此论文的Space(空间)0

没有链接此论文的Space

请在Space README.md 中引用 arxiv.org/abs/2605.14892,以在此页面建立链接。

包含此论文的收藏0

没有包含此论文的收藏

请将这篇论文添加到收藏中,以在此页面建立链接。

相似文章

从存储到经验:大语言模型智能体记忆机制演进综述

Hugging Face Daily Papers

本综述论文提出了一种大语言模型(LLM)智能体记忆机制的演进框架,将其发展划分为三个阶段:存储、反思和经验。文章分析了长程一致性和持续学习等核心驱动力,旨在为下一代智能体的设计提供指导原则。

法律中多智能体协商研究

arXiv cs.AI

本文研究了使用LLM进行法律推理任务的多智能体协商方法,引入了两种受法庭程序启发的新框架。实验表明,多智能体系统在整体性能上与单一LLM相当,但能产生截然不同的答案,并能解决基线模型无法处理的案例,突显了多智能体方法在法律AI中的潜力。

重新思考自进化大语言模型智能体的持续经验内化

arXiv cs.CL

本文研究了大语言模型智能体在多轮迭代经验内化过程中出现能力渐进式崩溃的原因,并提出了一套从经验粒度、注入模式和训练机制三个维度出发的鲁棒解决方案。主要发现包括:原则级经验、逐步注入方式以及离策略上下文蒸馏能够带来更稳定、更可持续的持续学习效果。