FlowBank: 通过预计算和重用的查询自适应智能体工作流优化
摘要
FlowBank引入了一个三阶段框架,通过预计算一组多样化的可重用工作流并自适应地为每个查询选择最佳工作流,来优化LLM多智能体系统中的智能体工作流,在保持成本竞争力的同时实现了更高的分数。
arXiv:2606.11290v1 公告类型:新
摘要:基于大型语言模型(LLM)的多智能体系统越来越强大,但当前的智能体工作流优化范式存在不令人满意的权衡。任务级方法耗费大量离线计算资源,却只部署单一工作流,导致互补候选未被利用;而查询级方法为每个查询合成新工作流,推理成本高昂。我们的动机分析表明,这些范式互补性大于竞争性:离线搜索中发现的工作流通常能解决不同子集的查询,而许多由昂贵的查询级生成处理的查询已经可以通过更便宜的预计算工作流解决。这暗示了一个不同的目标:与其寻找一个通用的最佳工作流或为每个实例重新生成,不如构建一个紧凑的、可重用的互补工作流库,并在推理时自适应地选择。为此,需要解决三个耦合问题:生成互补而非冗余的候选、将其压缩成可部署的小型组合、在性能与成本权衡下为每个查询分配正确的工作流。基于此,我们提出了FlowBank,一个基于组合的智能体工作流优化三阶段框架。多样化阶段提出DiverseFlow,引导搜索覆盖不足的查询,生成高覆盖候选池。精选阶段提出CuraFlow,将候选池压缩为冗余最小的紧凑组合。匹配阶段将部署视为查询-工作流二分图上的边值预测,将每个传入查询路由到预测效用最高的组合成员。在五个基准测试中,FlowBank在保持成本竞争力的同时取得了评估方法中的最高平均分,相对于最强自动基线和手工基线分别相对提升了4.26%和14.92%。
查看缓存全文
缓存时间: 2026/06/11 13:46
# FlowBank:通过预计算与重用的查询自适应智能体工作流优化 来源:https://arxiv.org/abs/2606.11290 查看 PDF(https://arxiv.org/pdf/2606.11290) > 摘要:基于大语言模型(LLM)的多智能体系统日益强大,但当前的智能体工作流优化范式存在令人不满意的权衡。任务级方法消耗大量离线计算资源却仅部署单一工作流,使互补候选方案闲置;而查询级方法为每个查询合成新工作流,推理成本高昂。我们的动机分析表明,这些范式更多是互补而非竞争:离线搜索中发现的工作流通常各自解决不同的查询子集;许多由昂贵的查询级生成处理的查询,实际上可以通过更便宜的预计算工作流解决。这暗示了一个不同的目标:与其寻找一个普遍最优的工作流或为每个实例重新生成一个,不如构建一个紧凑的、可重复使用的互补工作流库,并在推理时自适应地从中选择。实现这一目标需要解决三个耦合问题:生成互补而非冗余的候选方案;将其压缩为可部署的小型组合;在性能-成本权衡下将每个查询分配给正确的工作流。为此,我们提出 FlowBank,一个基于组合的智能体工作流优化三阶段框架。**多样化(Diversifying)** 提出 DiverseFlow,引导搜索覆盖不足的查询,生成高覆盖率的候选池。**策划(Curating)** 提出 CuraFlow,将该池压缩为冗余最小的紧凑组合。**匹配(Matching)** 将部署建模为查询-工作流二分图上的边缘价值预测,并将每个传入查询路由到预测效用最高的组合成员。在五个基准测试中,FlowBank 在评估方法中取得了最高平均分,同时保持成本竞争力,相比最强自动基线和手工基线分别相对提升 4.26% 和 14.92%。 ## 提交历史 发自:Lingzhi Yuan [查看邮箱(https://arxiv.org/show-email/543e7a2f/2606.11290)] **[v1]** 2026年6月9日星期二 17:58:21 UTC(545 KB)
相似文章
面向LLM赋能代理工作流的可靠设计:优化延迟-可靠性-成本权衡
本文分析了LLM赋能代理工作流中延迟、可靠性和成本之间的权衡,引入了性能模型,并推导出了如注水令牌分配等最优资源分配策略。
AgentCo-op: 基于检索的可互操作多智能体工作流合成框架
AgentCo-op 是一个基于检索的合成框架,用于从可复用的技能、工具和外部智能体组合可互操作的多智能体工作流。它使用类型化工件传递和有界自引导局部修复,在多个基准测试上取得了优异结果,并能在开放世界的基因组学任务中实现协作发现。
工具即连续流:用于演进式智能体推理
本文介绍了 FlowAgent,这是一个新颖的框架,它利用条件流匹配将工具链重新概念化为连续轨迹生成,以提高长时序智能体推理的鲁棒性。
@AdamRLucek: 我对代理集群(即工作流)持乐观态度。代理正越来越多地被用于分析整理海量数据……
作者讨论了在规模化处理非结构化数据时,代理集群/工作流的使用日益增长,并指出当并行部署超过30个子代理时,可靠执行会显著下降,同时预告了一种将智能决策与可靠任务执行相结合的解决方案。
@hooeem: https://x.com/hooeem/status/2062266452921491934
一份指南,解释如何通过将固定流程编译成更小的微调模型,而不是反复提示前沿模型,从而使代理工作流成本降低高达462倍。