FlowCompile:结构化LLM工作流的优化编译器

Hugging Face Daily Papers 论文

摘要

FlowCompile 是一个用于结构化LLM工作流的编译器,它在编译时探索配置以平衡准确性和延迟,无需重新训练即可实现最高6.4倍的加速。

结构化LLM工作流,即专用LLM子代理根据预定义图执行,已成为解决复杂任务的强大抽象。优化此类工作流(即选择每个子代理的配置以平衡准确性和延迟)具有挑战性,因为模型选择、推理预算和工作流结构构成了组合设计空间。现有的成本感知方法大多将工作流优化视为路由问题,在推理时根据训练时使用的准确-延迟目标为每个查询选择配置。我们认为,结构化LLM工作流也可以从编译角度进行优化:在部署之前,系统可以全局探索工作流设计空间,并构建一组可重用的工作流级配置,涵盖不同的准确-延迟权衡。受机器学习编译器的启发,我们引入了FlowCompile,一种结构化LLM工作流编译器,它通过编译时设计空间探索来识别高质量、可重用的权衡集。FlowCompile将工作流分解为子代理,在不同配置下对每个子代理进行性能分析,并通过结构感知代理组合这些测量结果,以估计工作流级别的准确性和延迟。然后,它在一次编译时过程中识别出多样化的高质量配置,无需重新训练或在线适应。跨不同工作流和具有挑战性基准的实验表明,FlowCompile 始终优于启发式优化的工作流配置和基于路由的基线,实现了高达6.4倍的加速。编译后的配置集还可作为可重用的优化工件,支持在不同运行时偏好下灵活部署,并支持下游选择或路由。
查看原文
查看缓存全文

缓存时间: 2026/05/15 00:21

论文页面 - FlowCompile:一种面向结构化LLM工作流的优化编译器

来源:https://huggingface.co/papers/2605.13647

摘要

FlowCompile 是一种结构化 LLM 工作流编译器,通过在编译时探索工作流配置,在不重新训练的情况下平衡准确率和延迟,从而优化复杂的多智能体任务。

结构化 LLM 工作流(https://huggingface.co/papers?q=Structured%20LLM%20workflows)中,专门的 LLM 子代理(https://huggingface.co/papers?q=sub-agents)按照预定义图执行,已成为解决复杂任务的有力抽象。优化此类工作流(即为每个子代理选择配置以平衡准确率和延迟)极具挑战,因为模型选择、推理预算和工作流结构构成了组合性的设计空间。现有的成本感知方法主要将工作流优化(https://huggingface.co/papers?q=workflow%20optimization)视为路由问题:在推理时根据训练所用准确率-延迟目标为每个查询选择配置。我们认为,结构化 LLM 工作流(https://huggingface.co/papers?q=structured%20LLM%20workflows)也可以从编译的角度进行优化:在部署前,系统可以全局探索工作流设计空间,构建一组可复用的工作流级别配置(https://huggingface.co/papers?q=workflow-level%20configurations),覆盖多样化的准确率-延迟权衡(https://huggingface.co/papers?q=accuracy-latency%20trade-offs)。受机器学习编译器(https://huggingface.co/papers?q=machine%20learning%20compilers)启发,我们提出了 FlowCompile——一种结构化 LLM 工作流编译器,它执行编译时设计空间探索(https://huggingface.co/papers?q=compile-time%20design%20space%20exploration)以识别高质量、可复用的权衡集。FlowCompile 将工作流分解为子代理(https://huggingface.co/papers?q=sub-agents),在多种配置下对每个子代理进行剖析,并通过结构感知代理(https://huggingface.co/papers?q=structure-aware%20proxy)组合这些测量结果以估计工作流级别的准确率和延迟。然后,它在单次编译时扫描中识别多样化的高质量配置,无需重新训练或在线自适应。跨不同工作流和具有挑战性的基准测试的实验表明,FlowCompile 始终优于启发式优化的工作流配置和基于路由的基线,可实现高达 6.4 倍的加速。编译后的配置集进一步作为可复用的优化产物,支持在变化的运行时偏好(https://huggingface.co/papers?q=runtime%20preferences)下灵活部署,并促进下游选择或路由。

查看 arXiv 页面 (https://arxiv.org/abs/2605.13647) 查看 PDF (https://arxiv.org/pdf/2605.13647) GitHub0 (https://github.com/UMass-Embodied-AGI/FlowCompile) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.13647)

在您的代理中获取此论文:

hf papers read 2605\.13647

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型引用此论文

在模型 README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。

引用此论文的数据集0

没有数据集引用此论文

在数据集 README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。

引用此论文的 Space0

没有 Space 引用此论文

在 Space README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。

包含此论文的收藏集0

没有收藏集包含此论文

将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。

相似文章