FlowCompile：结构化LLM工作流的优化编译器

Hugging Face Daily Papers 2026/05/13 00:00 论文

llm-workflows compiler optimization multi-agent accuracy-latency machine-learning-compilers

摘要

FlowCompile 是一个用于结构化LLM工作流的编译器，它在编译时探索配置以平衡准确性和延迟，无需重新训练即可实现最高6.4倍的加速。

结构化LLM工作流，即专用LLM子代理根据预定义图执行，已成为解决复杂任务的强大抽象。优化此类工作流（即选择每个子代理的配置以平衡准确性和延迟）具有挑战性，因为模型选择、推理预算和工作流结构构成了组合设计空间。现有的成本感知方法大多将工作流优化视为路由问题，在推理时根据训练时使用的准确-延迟目标为每个查询选择配置。我们认为，结构化LLM工作流也可以从编译角度进行优化：在部署之前，系统可以全局探索工作流设计空间，并构建一组可重用的工作流级配置，涵盖不同的准确-延迟权衡。受机器学习编译器的启发，我们引入了FlowCompile，一种结构化LLM工作流编译器，它通过编译时设计空间探索来识别高质量、可重用的权衡集。FlowCompile将工作流分解为子代理，在不同配置下对每个子代理进行性能分析，并通过结构感知代理组合这些测量结果，以估计工作流级别的准确性和延迟。然后，它在一次编译时过程中识别出多样化的高质量配置，无需重新训练或在线适应。跨不同工作流和具有挑战性基准的实验表明，FlowCompile 始终优于启发式优化的工作流配置和基于路由的基线，实现了高达6.4倍的加速。编译后的配置集还可作为可重用的优化工件，支持在不同运行时偏好下灵活部署，并支持下游选择或路由。

查看原文

查看缓存全文

缓存时间: 2026/05/15 00:21

论文页面 - FlowCompile：一种面向结构化LLM工作流的优化编译器

来源：https://huggingface.co/papers/2605.13647

摘要

FlowCompile 是一种结构化 LLM 工作流编译器，通过在编译时探索工作流配置，在不重新训练的情况下平衡准确率和延迟，从而优化复杂的多智能体任务。

结构化 LLM 工作流（https://huggingface.co/papers?q=Structured%20LLM%20workflows）中，专门的 LLM 子代理（https://huggingface.co/papers?q=sub-agents）按照预定义图执行，已成为解决复杂任务的有力抽象。优化此类工作流（即为每个子代理选择配置以平衡准确率和延迟）极具挑战，因为模型选择、推理预算和工作流结构构成了组合性的设计空间。现有的成本感知方法主要将工作流优化（https://huggingface.co/papers?q=workflow%20optimization）视为路由问题：在推理时根据训练所用准确率-延迟目标为每个查询选择配置。我们认为，结构化 LLM 工作流（https://huggingface.co/papers?q=structured%20LLM%20workflows）也可以从编译的角度进行优化：在部署前，系统可以全局探索工作流设计空间，构建一组可复用的工作流级别配置（https://huggingface.co/papers?q=workflow-level%20configurations），覆盖多样化的准确率-延迟权衡（https://huggingface.co/papers?q=accuracy-latency%20trade-offs）。受机器学习编译器（https://huggingface.co/papers?q=machine%20learning%20compilers）启发，我们提出了 FlowCompile——一种结构化 LLM 工作流编译器，它执行编译时设计空间探索（https://huggingface.co/papers?q=compile-time%20design%20space%20exploration）以识别高质量、可复用的权衡集。FlowCompile 将工作流分解为子代理（https://huggingface.co/papers?q=sub-agents），在多种配置下对每个子代理进行剖析，并通过结构感知代理（https://huggingface.co/papers?q=structure-aware%20proxy）组合这些测量结果以估计工作流级别的准确率和延迟。然后，它在单次编译时扫描中识别多样化的高质量配置，无需重新训练或在线自适应。跨不同工作流和具有挑战性的基准测试的实验表明，FlowCompile 始终优于启发式优化的工作流配置和基于路由的基线，可实现高达 6.4 倍的加速。编译后的配置集进一步作为可复用的优化产物，支持在变化的运行时偏好（https://huggingface.co/papers?q=runtime%20preferences）下灵活部署，并促进下游选择或路由。

查看 arXiv 页面 (https://arxiv.org/abs/2605.13647) 查看 PDF (https://arxiv.org/pdf/2605.13647) GitHub0 (https://github.com/UMass-Embodied-AGI/FlowCompile) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.13647)

在您的代理中获取此论文：

hf papers read 2605\.13647

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型引用此论文

在模型 README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。

引用此论文的数据集0

没有数据集引用此论文

在数据集 README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。

引用此论文的 Space0

没有 Space 引用此论文

在 Space README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。

包含此论文的收藏集0

没有收藏集包含此论文

将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。

FlowCompile：结构化LLM工作流的优化编译器

论文页面 - FlowCompile：一种面向结构化LLM工作流的优化编译器

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的 Space0

包含此论文的收藏集0

相似文章

LeanFlow：工作流驱动的Lean自动形式化案例研究

[R] 将代理工作流编译到LLM权重中：以两个数量级的成本降低实现接近前沿质量

ReaComp：将LLM推理编译为符号求解器以实现高效程序合成

FlowEdit：针对涉及冲突的不适定问题的LLM推理流的信息论控制

弥合LLM代码翻译中功能正确性与运行时效率的差距

提交意见反馈