FlowCompile:结构化LLM工作流的优化编译器
摘要
FlowCompile 是一个用于结构化LLM工作流的编译器,它在编译时探索配置以平衡准确性和延迟,无需重新训练即可实现最高6.4倍的加速。
查看缓存全文
缓存时间: 2026/05/15 00:21
论文页面 - FlowCompile:一种面向结构化LLM工作流的优化编译器
来源:https://huggingface.co/papers/2605.13647
摘要
FlowCompile 是一种结构化 LLM 工作流编译器,通过在编译时探索工作流配置,在不重新训练的情况下平衡准确率和延迟,从而优化复杂的多智能体任务。
结构化 LLM 工作流(https://huggingface.co/papers?q=Structured%20LLM%20workflows)中,专门的 LLM 子代理(https://huggingface.co/papers?q=sub-agents)按照预定义图执行,已成为解决复杂任务的有力抽象。优化此类工作流(即为每个子代理选择配置以平衡准确率和延迟)极具挑战,因为模型选择、推理预算和工作流结构构成了组合性的设计空间。现有的成本感知方法主要将工作流优化(https://huggingface.co/papers?q=workflow%20optimization)视为路由问题:在推理时根据训练所用准确率-延迟目标为每个查询选择配置。我们认为,结构化 LLM 工作流(https://huggingface.co/papers?q=structured%20LLM%20workflows)也可以从编译的角度进行优化:在部署前,系统可以全局探索工作流设计空间,构建一组可复用的工作流级别配置(https://huggingface.co/papers?q=workflow-level%20configurations),覆盖多样化的准确率-延迟权衡(https://huggingface.co/papers?q=accuracy-latency%20trade-offs)。受机器学习编译器(https://huggingface.co/papers?q=machine%20learning%20compilers)启发,我们提出了 FlowCompile——一种结构化 LLM 工作流编译器,它执行编译时设计空间探索(https://huggingface.co/papers?q=compile-time%20design%20space%20exploration)以识别高质量、可复用的权衡集。FlowCompile 将工作流分解为子代理(https://huggingface.co/papers?q=sub-agents),在多种配置下对每个子代理进行剖析,并通过结构感知代理(https://huggingface.co/papers?q=structure-aware%20proxy)组合这些测量结果以估计工作流级别的准确率和延迟。然后,它在单次编译时扫描中识别多样化的高质量配置,无需重新训练或在线自适应。跨不同工作流和具有挑战性的基准测试的实验表明,FlowCompile 始终优于启发式优化的工作流配置和基于路由的基线,可实现高达 6.4 倍的加速。编译后的配置集进一步作为可复用的优化产物,支持在变化的运行时偏好(https://huggingface.co/papers?q=runtime%20preferences)下灵活部署,并促进下游选择或路由。
查看 arXiv 页面 (https://arxiv.org/abs/2605.13647) 查看 PDF (https://arxiv.org/pdf/2605.13647) GitHub0 (https://github.com/UMass-Embodied-AGI/FlowCompile) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.13647)
在您的代理中获取此论文:
hf papers read 2605\.13647
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有模型引用此论文
在模型 README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。
引用此论文的数据集0
没有数据集引用此论文
在数据集 README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。
引用此论文的 Space0
没有 Space 引用此论文
在 Space README.md 中引用 arxiv.org/abs/2605.13647 以从此页面链接。
包含此论文的收藏集0
没有收藏集包含此论文
将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。
相似文章
ReaComp:将LLM推理编译为符号求解器以实现高效程序合成
ReaComp将LLM推理轨迹编译为可重用的符号程序合成器,在程序合成基准测试中实现了强大的准确性,同时消除了测试时的LLM调用,显著降低了计算成本。
DataFlow:面向数据为中心AI时代的统一数据准备与工作流自动化的LLM驱动框架
DataFlow是一个LLM驱动的框架,用于自动化数据准备和工作流工程,具备近200个可复用算子和六个领域通用流程,可在数学、代码和Text-to-SQL等任务上提升LLM性能。
我们不再手动优化 LLM 技术栈——现在它实现了自我优化
本文描述了一家企业如何实现向自我优化 LLM 技术栈的转型。该系统利用生产环境中的调用追踪数据,自动路由请求并微调模型,从而显著降低了成本并提升了性能。
本地LLM实战测试:代码生成、质量与速度权衡
作者构建了一个基准测试框架,用于评估本地LLM在自动生成Go代码方面的能力,重点聚焦SIEM流水线的日志解析器生成,并发布了对比质量与速度的测试结果。
@_vmlops: Anthropic 悄悄在 Claude Code 中推出了 /workflows,其背后的原理让我领悟到:旧模式 → 一个 LLM 或…
Anthropic 悄悄在 Claude Code 中推出了 /workflows,用基于代码的控制流取代了 LLM 编排器,以避免 token 开销和上下文混乱问题。