超越基于提示的规划:面向生物医学智能体系统的MCP原生图规划方法
摘要
BioManus 是一个 MCP 原生生物医学智能体系统,它采用基于图脚手架的规划方式,对结构化生物学能力进行调度,而非依赖扁平化的基于提示的工具检索,在生物医学基准测试中实现了更优的上下文效率与执行精度。该系统引入了 BioinfoMCP 编译器,用于标准化异构生物信息学工具,并将其组织为类型化异构 MCP 图,以支持可扩展的推理能力。
arXiv:2606.04494v1 公告类型:新论文
**摘要:** 生物医学智能体有望实现复杂生物工作流程的自动化,然而当前系统面临两大根本性瓶颈:生物信息学工具在接口与执行环境上高度异构,而智能体规划仍依赖扁平化的基于提示的工具描述检索。随着生物医学软件生态系统的不断扩展,工具覆盖范围与上下文规模之间的强耦合关系导致工具混淆、规划不稳定以及执行效率低下等问题。
我们提出 BioManus,一个基于图脚手架规划构建的 MCP 原生生物医学智能体,其规划过程作用于结构化生物学能力之上。BioManus 首先引入 BioinfoMCP 编译器,将异构生物信息学软件转换为标准化的 MCP 服务器,从而构建出一个大规模可执行的 MCP 生态系统。随后,系统将该生态系统组织为一个类型化异构 MCP 图,涵盖工具、操作、数据类型及工作流阶段等维度。在推理阶段,BioManus 检索紧凑的任务特定子图,并合成操作级别的工作流脚手架。这一设计将规划复杂度与原始工具库规模解耦,在高召回率检索条件下实现了 Θ(N / (h × m̄)) 的上下文压缩比,其中 N 为工具总数,h 为工作流跨度,m̄(远小于 N)为每个操作的平均候选工具数量。
在 BioAgentBench 和 LAB-Bench 上的实验表明,BioManus 在执行精度、工作流有效性和上下文效率方面均优于现有先进生物医学智能体基线系统。本研究揭示了一种范式转变:可扩展的生物医学推理需要结构化可执行能力图,而非规模不断膨胀的提示级工具检索。
查看缓存全文
缓存时间: 2026/06/05 02:07
# 超越基于提示的规划:原生 MCP 图规划生物医学智能体系统 来源:https://arxiv.org/abs/2606.04494 查看 PDF (https://arxiv.org/pdf/2606.04494) > 摘要:生物医学智能体有望自动化复杂的生物工作流程,然而当前系统面临两个根本性瓶颈:生物信息学工具在接口和执行环境上高度异构,而智能体规划仍然依赖于基于扁平提示检索的工具描述。随着生物医学软件生态系统的不断扩展,工具覆盖范围与上下文大小之间的耦合关系导致了工具混淆、规划不稳定以及执行效率低下等问题。我们提出 BioManus——一个基于结构化生物能力图脚手架规划的原生 MCP 生物医学智能体。BioManus 首先引入 BioinfoMCP 编译器,将异构生物信息学软件转换为标准化的 MCP 服务器,从而构建出一个大规模可执行的 MCP 生态系统。随后,系统将该生态系统组织为一个涵盖工具、操作、数据类型和工作流阶段的有类型异构 MCP 图。在推理阶段,BioManus 检索紧凑的任务专属子图,并合成操作级别的工作流脚手架。这一设计将规划复杂度与原始工具库规模解耦,在高召回率检索条件下实现了 Θ(N / (h × m̄)) 的上下文压缩比,其中 N 为工具总数,h 为工作流规划步长,m̄(远小于 N)为每个操作的平均候选工具数量。在 BioAgentBench 和 LAB-Bench 上的实验表明,BioManus 在执行准确性、工作流有效性和上下文效率方面均优于先进的生物医学智能体基线。本研究表明一种范式转变:可扩展的生物医学推理需要结构化可执行能力图,而非规模不断膨胀的提示级工具检索。 ## 提交历史 作者:Zhangtianyi Chen \[查看邮箱 (https://arxiv.org/show-email/4ef2fc34/2606.04494)\] **\[v1\]** 2026年6月3日(周三)06:19:25 UTC(987 KB)
相似文章
CP-Agent: 面向化学扰动下细胞形态轮廓分析的情境感知多模态推理
CP-Agent 是一个多模态大语言模型,它利用情境感知对齐(CP-CLIP)来解释化学扰动下的细胞形态变化,从而为药物发现提供可解释且可扩展的表型筛选。
构建 Agentic GraphRAG 系统:从知识图谱和本体论到作为 AI 智能体 MCP 服务器的统一记忆
作者认为 GraphRAG 本质上是一个数据建模问题,而非单纯的检索算法,并提出了一种包含五个组件的架构,利用本体论、知识图谱和 MCP 服务器为智能体提供统一记忆。
使用 MCP 进行代码执行:构建更高效的智能体
本文来自 Anthropic,探讨了如何将代码执行与 Model Context Protocol (MCP) 相结合,以提升 AI 智能体的效率。文章分析了工具定义和中间结果导致的 token 过载等挑战,并提出代码执行作为降低延迟和成本的解决方案。
PersonalAI 2.0: 通过规划机制增强知识图谱遍历与检索,面向个性化LLM智能体
PersonalAI 2.0 引入了一个框架,通过集成外部知识图谱与动态多阶段查询处理及自适应规划机制,增强了基于LLM的系统,在多个基准测试中实现了幻觉率降低和精度提升。
agency-os:将Notion作为AI代理的调度面板 - 开源、MIT许可、原生MCP支持、兼容Claude Code、Cursor、Cline或任何MCP接口
agency-os是一款开源工具,可将Notion转变为AI代理的编排层,允许用户规划任务、审批任务树,并通过MCP调度代理。它支持模型路由和依赖解析,兼容Claude Code、Cursor、Cline及其他支持MCP的代理。