AgentSPEX:一种智能体规范与执行语言

Hugging Face Daily Papers 论文

摘要

AgentSPEX 提出了一种领域专用语言,用于构建模块化、可解释的大模型智能体工作流,具备显式控制流、状态管理与可视化编辑器,性能优于现有 Python 耦合框架。

大模型智能体系统普遍采用“反应式提示”,即通过一条指令引导模型在开放的推理与工具调用序列中前进,导致控制流与中间状态隐式化,智能体行为难以掌控。LangGraph、DSPy、CrewAI 等编排框架通过显式工作流定义增加结构,却将工作流逻辑与 Python 紧耦合,使智能体难以维护与修改。本文提出 AgentSPEX,一种 Agent SPecification and EXecution Language,用于以显式控制流与模块化结构规范大模型智能体工作流,并配套可定制的智能体运行时。AgentSPEX 支持类型化步骤、分支与循环、并行执行、可复用子模块及显式状态管理;工作流在智能体运行时内执行,运行时提供工具访问、沙箱虚拟环境,以及检查点、验证与日志功能。此外,我们提供可视化编辑器,同步展示图结构与工作流视图,便于编写与审查。我们内置了深度研究与科学研究两个即用智能体,并在 7 项基准上评估 AgentSPEX。最后,用户研究表明,AgentSPEX 的工作流编写范式比现有主流智能体框架更易解释、更易上手。
查看原文
查看缓存全文

缓存时间: 2026/04/22 06:17

论文页面 - AgentSPEX:一种Agent规范与执行语言

来源:https://huggingface.co/papers/2604.13346

摘要

AgentSPEX 是一种领域特定语言与框架,用于构建结构化、模块化且可解释的大模型智能体工作流,具备显式控制流与状态管理。

大模型智能体系统通常依赖“反应式提示”:一条指令引导模型完成开放式推理与工具调用,控制流与中间状态全部隐含,导致行为难以掌控。LangGraph、DSPy、CrewAI 等编排框架通过显式工作流定义增加结构,却把工作流逻辑与 Python 深度耦合,维护与修改困难。本文提出 AgentSPEX——Agent 规范与执行语言,用显式控制流与模块化结构描述 LLM 智能体工作流,并配套可定制的智能体运行时。AgentSPEX 支持类型化步骤、分支与循环、并行执行、可复用子模块及显式状态管理;运行时提供工具调用、沙箱虚拟环境,以及检查点、验证与日志功能。我们还提供可视化编辑器,同步展示图视图与工作流视图,便于编写与调试。论文内置深度研究与科学研究两类即用智能体,并在 7 项基准上评估。用户研究表明,相比主流框架,AgentSPEX 的工作流编写范式更易读、更易用。

查看 arXiv 页面(https://arxiv.org/abs/2604.13346)
查看 PDF(https://arxiv.org/pdf/2604.13346)
项目主页(https://agentspex.ai/)
GitHub11(https://github.com/ScaleML/AgentSPEX)
添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2604.13346)

在智能体里阅读本文:

hf papers read 2604.13346

还没装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash

引用本文的模型 0

暂无模型引用

在模型 README.md 中引用 arxiv.org/abs/2604.13346,即可在此显示。

引用本文的数据集 0

暂无数据集引用

在数据集 README.md 中引用 arxiv.org/abs/2604.13346,即可在此显示。

引用本文的 Spaces 0

暂无 Space 引用

在 Space 中引用 arxiv.org/abs/2604.13346,即可在此显示。

收录本文的合集 1

相似文章

语言模型代理的自我编程执行

arXiv cs.AI

本文介绍了自我编程执行(SPE),这是一种代理架构,其中语言模型生成其自身的编排程序,而非依赖固定的外部框架。文章提出了“Spell”,一种基于 Lisp 的语言,支持自我编辑和重新求值,并展示了前沿模型能够利用该方法成功执行代理任务。

Agentspan

Product Hunt

Agentspan 是一个用于构建持久性AI代理的开源运行时。