FlowBank: 通过预计算和重用的查询自适应智能体工作流优化

arXiv cs.LG 2026/06/11 04:00 论文

摘要

FlowBank引入了一个三阶段框架，通过预计算一组多样化的可重用工作流并自适应地为每个查询选择最佳工作流，来优化LLM多智能体系统中的智能体工作流，在保持成本竞争力的同时实现了更高的分数。

arXiv:2606.11290v1 公告类型：新摘要：基于大型语言模型（LLM）的多智能体系统越来越强大，但当前的智能体工作流优化范式存在不令人满意的权衡。任务级方法耗费大量离线计算资源，却只部署单一工作流，导致互补候选未被利用；而查询级方法为每个查询合成新工作流，推理成本高昂。我们的动机分析表明，这些范式互补性大于竞争性：离线搜索中发现的工作流通常能解决不同子集的查询，而许多由昂贵的查询级生成处理的查询已经可以通过更便宜的预计算工作流解决。这暗示了一个不同的目标：与其寻找一个通用的最佳工作流或为每个实例重新生成，不如构建一个紧凑的、可重用的互补工作流库，并在推理时自适应地选择。为此，需要解决三个耦合问题：生成互补而非冗余的候选、将其压缩成可部署的小型组合、在性能与成本权衡下为每个查询分配正确的工作流。基于此，我们提出了FlowBank，一个基于组合的智能体工作流优化三阶段框架。多样化阶段提出DiverseFlow，引导搜索覆盖不足的查询，生成高覆盖候选池。精选阶段提出CuraFlow，将候选池压缩为冗余最小的紧凑组合。匹配阶段将部署视为查询-工作流二分图上的边值预测，将每个传入查询路由到预测效用最高的组合成员。在五个基准测试中，FlowBank在保持成本竞争力的同时取得了评估方法中的最高平均分，相对于最强自动基线和手工基线分别相对提升了4.26%和14.92%。

查看原文

查看缓存全文

缓存时间: 2026/06/11 13:46

# FlowBank：通过预计算与重用的查询自适应智能体工作流优化
来源：https://arxiv.org/abs/2606.11290
查看 PDF（https://arxiv.org/pdf/2606.11290）

> 摘要：基于大语言模型（LLM）的多智能体系统日益强大，但当前的智能体工作流优化范式存在令人不满意的权衡。任务级方法消耗大量离线计算资源却仅部署单一工作流，使互补候选方案闲置；而查询级方法为每个查询合成新工作流，推理成本高昂。我们的动机分析表明，这些范式更多是互补而非竞争：离线搜索中发现的工作流通常各自解决不同的查询子集；许多由昂贵的查询级生成处理的查询，实际上可以通过更便宜的预计算工作流解决。这暗示了一个不同的目标：与其寻找一个普遍最优的工作流或为每个实例重新生成一个，不如构建一个紧凑的、可重复使用的互补工作流库，并在推理时自适应地从中选择。实现这一目标需要解决三个耦合问题：生成互补而非冗余的候选方案；将其压缩为可部署的小型组合；在性能-成本权衡下将每个查询分配给正确的工作流。为此，我们提出 FlowBank，一个基于组合的智能体工作流优化三阶段框架。**多样化（Diversifying）** 提出 DiverseFlow，引导搜索覆盖不足的查询，生成高覆盖率的候选池。**策划（Curating）** 提出 CuraFlow，将该池压缩为冗余最小的紧凑组合。**匹配（Matching）** 将部署建模为查询-工作流二分图上的边缘价值预测，并将每个传入查询路由到预测效用最高的组合成员。在五个基准测试中，FlowBank 在评估方法中取得了最高平均分，同时保持成本竞争力，相比最强自动基线和手工基线分别相对提升 4.26% 和 14.92%。

## 提交历史

发自：Lingzhi Yuan [查看邮箱（https://arxiv.org/show-email/543e7a2f/2606.11290）] **[v1]** 2026年6月9日星期二 17:58:21 UTC（545 KB）

FlowBank: 通过预计算和重用的查询自适应智能体工作流优化

相似文章

面向LLM赋能代理工作流的可靠设计：优化延迟-可靠性-成本权衡

AgentCo-op: 基于检索的可互操作多智能体工作流合成框架

工具即连续流：用于演进式智能体推理

@AdamRLucek: 我对代理集群（即工作流）持乐观态度。代理正越来越多地被用于分析整理海量数据……

@hooeem: https://x.com/hooeem/status/2062266452921491934

提交意见反馈