面向大规模企业AI的自主事件驱动多智能体编排
摘要
本文评估了多智能体编排架构(DAG Plan and Execute、ReAct)在企业规模下的表现,并引入了一个任务管理器以实现持续的事件驱动操作,展示了在延迟和正确性方面的改进。
arXiv:2606.20058v1 公告类型:新提交
摘要:企业AI旨在实现跨专业智能体的持续事件监控、检测和行动,但现有的多智能体系统大多假设离散的请求-响应工作流,并且在企业规模下的研究尚不充分。我们评估了DAG Plan and Execute和ReAct两种架构在208个从生产环境衍生的企业场景中的表现,这些场景涵盖Persona(<10个智能体)、Department(20-80个)和Enterprise(200个)三种规模。我们引入了一个任务管理器,通过优先级推断、相关事件合并和抢占实现持续操作。结果表明,决定编排性能的主要因素是规模,而非任务复杂度:两种架构在小规模下表现良好,但在企业规模下性能下降,此时智能体发现噪声成为主要瓶颈,简单任务的退化比复杂任务更严重。DAG Plan and Execute在小规模下提供更高的精度和结构化并行化,但其较高的开销在企业规模下更为突出;ReAct通过增量处理失败而更加鲁棒。任务管理器将高优先级队列延迟降低了14-75%,并将企业规模下的相关事件正确性提升了超过20个百分点。
查看缓存全文
缓存时间: 2026/06/20 14:35
# 面向企业级AI的可扩展事件驱动型多智能体编排 来源:https://arxiv.org/abs/2606.20058 查看PDF(https://arxiv.org/pdf/2606.20058) > **摘要:** 企业级AI正朝着跨专业智能体的持续事件监控、检测与行动方向发展,然而现有的大多数多智能体系统仍假设离散的请求-响应工作流,且在企业规模下的研究尚不充分。本文在涵盖Persona(<10个智能体)、Department(20-80个)和Enterprise(200个)三种规模的208个生产衍生企业场景中,对DAG Plan and Execute与ReAct两种架构进行了评估,并引入了一个任务管理器,通过优先级推理、相关事件合并与抢占实现持续运行。结果表明,决定编排性能的主要因素是规模而非任务复杂度:两种架构在小规模下表现良好,但在企业规模下,随着智能体发现噪声成为主要瓶颈,性能出现下降,其中简单任务的下降幅度比复杂任务更为显著。DAG Plan and Execute在较小规模下提供了更高的精度和结构化并行能力,但其较高开销在企业规模下进一步恶化;ReAct则通过增量式错误处理展现出更强的鲁棒性。任务管理器将高优先级队列延迟降低了14%-75%,并在企业规模下将相关事件正确率提升超过20个百分点。 ## 提交历史 来自:Leonidas Raghav [查看邮件](https://arxiv.org/show-email/97c58942/2606.20058) **[v1]** 2026年6月18日星期四 10:32:38 UTC(2,801 KB)
相似文章
试验一种无 Leader 与消息传递机制的多智能体系统
作者详细介绍了一种基于有向无环图(DAG)的实验性多智能体编排框架,将核心智能集中在 Planner 和 RePlanner 组件中,而 Worker 智能体仅负责机械化执行。作者希望获取社区反馈、基准测试数据及相关研究,以验证该架构相较于传统消息传递方案的实际可行性。
跨整个组织的简单多智能体架构。让一切保持循环。
本文描述了一个大规模运行的多智能体架构,使用LangGraph、CrewAI和Harbor来处理目标智能体、任务协调以及带有追踪的安全访问。
有谁在生产环境中运行经过恰当编排的AI代理?
一位开发者寻求推荐用于多代理AI工作流程的生产编排工具,支持分支、重试和人在环审批,因为他们当前基于FastAPI的解决方案已变得难以维护。
是否有人在生产环境中部署了多智能体AI员工?
关于在生产环境中部署多智能体AI系统的讨论,其中不同的智能体负责规划、执行、沟通和项目管理,询问实际经验与瓶颈。
大多数所谓的“多智能体编排”不过是一个智能体在调用函数。停止将函数调用重新包装为智能体。
本文批评了“多智能体编排”这一术语的过度使用,指出许多实现实际上仅仅是单一智能体使用函数调用,而非真正的分布式系统。文章强调了一些经过生产环境验证的实用模式,如顺序流水线和人机协作工作流,作为复杂但低效架构的替代方案。