从提示到协议:实验室自动化的AI代理
摘要
本文介绍了一种AI代理,它将大型语言模型与实验室编排软件集成,使科学家能够使用自然语言创建、监控和管理自动化的实验室协议。在三个模拟实验室上的评估显示,该代理实现了97%的首次尝试协议生成成功率,并且所需的界面操作大幅减少。
arXiv:2605.16552v1 Announce Type: new
摘要:自动化的科学实验室能够实现更快、更安全、更准确且更具可重复性的协议执行,从而加速新材料、药物等的发现和测试。然而,建立和运行自主实验室需要协调众多仪器和机器人,迫使科学家编写代码、管理配置文件并应对复杂的软件基础设施。我们提出了一种AI代理架构,将大型语言模型与实验室编排相结合,使科学家能够使用自然语言交互式地创建和监控自动化实验室协议。该AI代理集成到实验编排系统(EOS)中,在自主循环中运行,具备自动验证和错误修正功能,并支持完整的实验生命周期:创建协议、运行和监控协议及闭环优化活动,以及分析结果。可视化图形编辑器将协议呈现为交互式节点图,与AI代理的协议表示同步,实现AI辅助与手动协议构建之间的无缝切换。在涵盖化学、生物学和材料科学的三个模拟自动化实验室上的评估显示,该AI代理实现了97%的首次尝试协议生成成功率,并且所需的界面操作减少了一个数量级。
查看缓存全文
缓存时间: 2026/05/19 06:34
# 从提示词到协议:用于实验室自动化的AI智能体
来源:https://arxiv.org/html/2605.16552
Angelos Angelopoulos1, James F\. Cahoon2, Ron Alterovitz1\*本研究由北卡罗来纳大学教堂山分校创造力中心资助。1Angelos Angelopoulos 和 Ron Alterovitz 就职于北卡罗来纳大学教堂山分校计算机科学系,邮编 NC 27599,美国,邮箱:\{aangelos,ron\}@cs\.unc\.edu2James Cahoon 就职于北卡罗来纳大学教堂山分校化学系,邮编 NC 27599,美国,邮箱:jfcahoon@unc\.edu
###### 摘要
实现科学实验室的自动化,能够以更快、更安全、更准确且更具可重复性的方式执行实验方案,从而加速新材料、新药物等的发现与测试。然而,搭建和运行自动化实验室需要协调大量仪器和机器人,迫使科学家编写代码、管理配置文件并应对复杂的软件基础设施。我们提出了一种AI智能体架构,将大语言模型与实验室编排系统集成,使科学家能够使用自然语言交互式地创建和监控自动化实验方案。该AI智能体被集成到实验编排系统(EOS)中,在一个具有自动验证和错误修正功能的智能体循环中运行,并支持完整的实验生命周期:创建协议、运行和监控协议及闭环优化活动,以及分析结果。一个可视化图形编辑器将协议呈现为交互式的基于节点的图表,并与AI智能体的协议表示实时同步,使用户能够在AI辅助和手动协议构建之间无缝切换。在涵盖化学、生物学和材料科学的三个模拟自动化实验室上进行的评估显示,该AI智能体首次尝试的协议生成成功率达到97%,并且所需界面操作减少了近一个数量级。
## I引言
实验室自动化能够使科学家以更快、更安全、更准确且更具可重复性的方式运行实验方案,从而加速新材料、新药物等的发现与测试[4 (https://arxiv.org/html/2605.16552#bib.bib5),1 (https://arxiv.org/html/2605.16552#bib.bib2),22 (https://arxiv.org/html/2605.16552#bib.bib22)]。实验室自动化的范围可以小到单个仪器的自动化,也可以大到跨分布式实验室协调复杂的多步骤协议[4 (https://arxiv.org/html/2605.16552#bib.bib5)]。搭建和运行自动化实验室通常需要协调大量仪器和机器人,这些仪器和机器人必须被调度和操作才能完成实验。为了支持这种协调,自动化实验室通常使用实验室编排软件,为科学家提供定义和执行多步骤协议的标准接口。编排器可以自动调度任务在何时以及何种仪器上运行,管理到各种实验室硬件的连接,收集并整理来自协议运行的数据,并提供用于优化协议参数的框架[3 (https://arxiv.org/html/2605.16552#bib.bib6),12 (https://arxiv.org/html/2605.16552#bib.bib13),28 (https://arxiv.org/html/2605.16552#bib.bib28)]。然而,使用实验室编排软件创建和监控协议仍然非常繁琐。科学家通常需要使用Python或基于块的视觉编程来实现代码,编写配置文件,理解调度语义,并跨多个子系统监控执行。这些繁琐的步骤,化学家和其他物理科学家目前几乎没有接受过相关培训,成为实验室自动化采用的障碍[4 (https://arxiv.org/html/2605.16552#bib.bib5)]。
参见图注图1:EOS AI智能体使科学家能够通过自然语言创建实验协议、监控实验活动并分析结果,并结合交互式可视化图形编辑器。在本文中,我们提出了一种AI智能体架构,该架构将大语言模型与实验室编排系统集成,使科学家能够使用自然语言交互式地创建和监控自动化协议。该AI智能体由最先进的大语言模型驱动,使科学家能够创建协议、提交协议执行、监控协议运行、使用这些协议运行优化活动,以及查询和分析生成的数据,所有这些都无需编写代码或配置文件。例如,科学家可以要求AI智能体“将三种输入试剂各10mL加入烧瓶中,使用磁力搅拌器搅拌20秒,并使用质谱法对溶液进行表征”,AI智能体通过推理可用设备、已实现的任务能力和实验室约束,生成一个完整、经过验证的协议(由任务和相关参数组成的有向无环图表示)。
我们将此AI智能体集成到实验编排系统(EOS)中,EOS是一个支持协议创建和监控的实验室编排软件[3 (https://arxiv.org/html/2605.16552#bib.bib6)]。EOS AI智能体在一个完整的智能体循环中运行:它推理科学家的请求,调用诸如读取任务规范文件等模型上下文协议(MCP)工具来收集信息和采取行动,使用EOS编排器的验证引擎通过MCP验证其生成的协议和其他输出,以检查结构正确性(例如,检查参数值是否在范围内),并自动检测和纠正错误,直到任务完成。我们通过一个MCP服务器暴露了超过40个工具,这些工具几乎涵盖了所有EOS功能,从而实现了AI智能体与EOS的集成。该AI智能体支持完整的实验生命周期,从在EOS中创建协议,到运行和监控协议以及闭环优化活动,再到分析结果。
我们将EOS AI智能体与一个可视化图形编辑器相结合,该编辑器将协议呈现为交互式的基于节点的图表。这使得科学家能够直观地验证和完善AI生成的协议。用户也可以根据需要直接在GUI中编辑图表。这些图表与AI智能体内部的协议表示实时同步,使用户能够在AI辅助的协议创建和手动基于GUI的协议创建之间无缝切换。
在本文中,我们将在第三节(https://arxiv.org/html/2605.16552#S3)从科学家的角度描述EOS AI智能体如何增强实验生命周期,在第四节(https://arxiv.org/html/2605.16552#S4)详细介绍实现,并在第五节(https://arxiv.org/html/2605.16552#S5)中通过三个具有代表性的模拟实验室协议进行演示:颜色混合、溶解度和纯化筛选,以及液-液萃取。
## II相关工作
自动化实验与机器学习相结合,可以创建自我驱动的实验室,加速物理和生命科学领域的发现[1 (https://arxiv.org/html/2605.16552#bib.bib2),22 (https://arxiv.org/html/2605.16552#bib.bib22),4 (https://arxiv.org/html/2605.16552#bib.bib5)]。自主平台已经合成了新材料[27 (https://arxiv.org/html/2605.16552#bib.bib27)],发现了满足多个属性目标的分子候选物[17 (https://arxiv.org/html/2605.16552#bib.bib17)],并通过机器学习探索了化学反应空间[13 (https://arxiv.org/html/2605.16552#bib.bib14)]。物理自动化已经从单一用途的设备发展到能够在站点之间运输样本的移动机器人[7 (https://arxiv.org/html/2605.16552#bib.bib8),5 (https://arxiv.org/html/2605.16552#bib.bib4)],以及由AI[9 (https://arxiv.org/html/2605.16552#bib.bib10)]或领域特定语言[26 (https://arxiv.org/html/2605.16552#bib.bib26),20 (https://arxiv.org/html/2605.16552#bib.bib20)]引导的模块化流动合成系统。贝叶斯优化被广泛用于指导自主过程优化的闭环活动[8 (https://arxiv.org/html/2605.16552#bib.bib9)]和快速材料发现[18 (https://arxiv.org/html/2605.16552#bib.bib18)]。随着这些实验室复杂性的增长,编排和可用性成为关键瓶颈[4 (https://arxiv.org/html/2605.16552#bib.bib5)]。
在软件方面,早期的实验室编排系统引入了自动化工作站的调度和并行性[2 (https://arxiv.org/html/2605.16552#bib.bib3)],而最近的编排器则专注于协调自我驱动实验室内的异构仪器[21 (https://arxiv.org/html/2605.16552#bib.bib21),3 (https://arxiv.org/html/2605.16552#bib.bib6)]。可视化编程环境旨在使非程序员也能创建协议[14 (https://arxiv.org/html/2605.16552#bib.bib15)],并且已经提出了类似操作系统的抽象来统一实验室软件基础设施[23 (https://arxiv.org/html/2605.16552#bib.bib23)]。大语言模型(LLM)已直接应用于实验室场景:Coscientist使用具有工具调用能力的GPT-4来自主规划和执行催化交叉偶联优化[6 (https://arxiv.org/html/2605.16552#bib.bib7)],ChemCrow用十八个专门的化学工具增强了LLM,涵盖合成规划、安全评估和属性预测[19 (https://arxiv.org/html/2605.16552#bib.bib19)],以及ORGANA将基于LLM的推理层与任务规划相结合[10 (https://arxiv.org/html/2605.16552#bib.bib11)]。然而,这些基于LLM的系统通常作为独立的智能体运行,与单个仪器或计算后端交互,而不是与功能完整的实验室编排器交互。
IvoryOS[28 (https://arxiv.org/html/2605.16552#bib.bib28)]是一个用户友好的基于Python的编排器,它通过内省Python脚本动态生成用于控制硬件的Web界面。它包含一个基于LLM的自然语言模式用于协议生成。然而,这种集成是无状态且单轮的,没有对话历史、工具调用或迭代改进。验证错误不会反馈给LLM进行修正,生成的协议是顺序的动作列表,不支持任务依赖关系或并行分支,并且LLM的范围仅限于协议创建。相比之下,EOS AI智能体提供了一个完整的智能体循环,可以跨多个步骤进行推理,生成具有并行分支的有向无环图协议,将验证错误反馈给LLM进行自动修正,并扩展到协议创建之外的监控和分析。
AlabOS[12 (https://arxiv.org/html/2605.16552#bib.bib13)]是一个用于自主实验室协议的Python框架,在A-Lab设施中进行了大规模演示,该设施协调了超过3500个材料样本的合成。该系统采用管理-工作架构,具有集中式资源管理,并将协议定义为有向无环图。AlabOS不提供AI辅助或自然语言界面;科学家必须使用Python代码编写协议。EOS AI智能体使科学家能够通过对话创建、提交和监控正在运行的协议。
ChemOS 2.0[24 (https://arxiv.org/html/2605.16552#bib.bib24)]是一个模块化编排器,其中组件通过SiLA2[16 (https://arxiv.org/html/2605.16552#bib.bib16)]通信,将计算模拟与物理协议集成,用于闭环活动。该系统提供了一个基于Streamlit的仪表板,科学家通过上传JSON参数文件提交作业,并通过查询作业标识符检索结果。然而,ChemOS 2.0不提供自然语言界面;多步骤协议需要Python代码来链式调用SiLA2设备并通过线程协调设备。相比之下,EOS AI智能体允许科学家使用自然语言生成完整的协议、查询结果和管理自动化实验室。
## III用AI增强实验室自动化
参见图注图2:EOS AI智能体与EOS用户界面集成。左侧:协议编辑器,AI智能体正在创建协议。右侧:优化活动进度跟踪,附有AI辅助的结果分析。EOS AI智能体支持科学家在整个实验过程中,从创建协议到监控执行和分析结果。我们将AI智能体集成到EOS Web界面中,使其在所有视图中都可访问,如图2 (https://arxiv.org/html/2605.16552#S3.F2) 所示。它根据科学家在界面中的当前上下文调整其行为。在以下小节中,我们将从科学家的角度描述AI智能体的能力。
### III-A创建协议
EOS AI智能体可以协助科学家创建协议,这是实验室自动化中的一项基本任务。科学家用自然语言描述他们的目标,AI智能体生成完整的协议,格式化为具有参数的任务有向无环图。为此,AI智能体从EOS接收完整的可用实验室资源上下文,包括任务规范、硬件设备规范、资源约束,以及正在创建的协议的当前状态。此上下文使AI智能体能够创建引用现有设备、尊重参数约束并满足任务依赖性的协议。
当AI智能体生成或修改协议时,更改会实时出现在可视化图形编辑器中,该编辑器以图形方式呈现协议。任务节点出现在画布上,在依赖的任务之间形成有向边,并且随着AI智能体的工作,参数配置会更新。如果科学家想要手动干预,他们可以直接编辑可视化图形,并且他们的更改会保存在AI智能体操作的同一底层协议表示中,从而实现AI辅助和手动协议构建之间的无缝切换。
AI智能体自动验证其生成的协议是否符合EOS编排器的要求,并迭代修正错误,无需科学家干预。EOS拥有一个广泛的验证引擎,涵盖结构正确性(例如,引用的设备存在且依赖关系无环)和任务规范中定义的科学约束(例如,参数范围和单位)。所有错误都被批量收集并一起返回,使AI智能体能够在单次修正步骤中处理每个错误。
### III-B监控协议运行和活动
除了创建协议,AI智能体还协助科学家监控协议运行和优化活动。科学家可以通过自然语言查询AI智能体关于任务、协议运行和活动的状态,而不是浏览多个数据视图和解释原始信息。对于单个协议运行,AI智能体可以报告哪些任务已完成、哪些正在运行以及哪些处于等待状态,并在协议的依赖结构上下文中解释这些信息,以识别可能阻塞下游执行的瓶颈或故障。对于优化活动,AI智能体可以解释优化进展、收敛行为以及已探索的参数区域。EOS界面还提供可视化的监控工具,例如目标值图表和帕累托前沿可视化,科学家可以与AI智能体讨论这些内容。
### III-C分析实验数据
AI智能体可以通过执行SQL查询以及执行代码来分析数据,直接查询EOS数据库中包含协议运行数据的内容。科学家可以要求AI智能体检索结果、计算统计摘要、识别趋势或比较不同协议运行的结果。除了简单的数据检索外,相似文章
科学领域的代理型AI实验
本文介绍了两个代理型AI框架:DeepTS/DeepCollector和DeepScribe,它们利用混合本地-云端架构和大语言模型,自动化科学工作流程,包括时间序列数据整理以及将物理讲座转化为结构化报告。
自动化智能体评估的实证研究
本文介绍了 EvalAgent,这是一个通过编码领域专业知识来自动化 AI 智能体评估的系统,旨在解决标准编程助手在此任务中的局限性。此外,本文还提出了用于测试评估流程的基准 AgentEvalBench,并展示了在评估可靠性方面的显著提升。
Stanford/Princeton AI4S 发布 LabOS²——这款从干实验室规划到湿实验室执行的自主AI系统,利用物理AI辅助科学家,现已能够执行完全自主的细胞培养工作流程。
斯坦福大学和普林斯顿大学的 AI4S 项目发布 LabOS²,这是一款能够执行完全自主细胞培养工作流程的智能体AI系统,涵盖从干实验室规划到湿实验室执行的全过程。
AgentNLQ:一种通用的自然语言到SQL代理
本文介绍了AgentNLQ,一个用于自然语言到SQL转换的多代理系统,通过模式增强和自校正编排器在BIRD基准测试上达到了78.1%的语义准确率。
用于改进临床试验工作流程准确性和效率的AI辅助协议信息提取
Banting Health AI的研究人员展示了一个利用生成式大语言模型和检索增强生成(RAG)技术进行临床试验协议信息自动提取的AI系统,准确率达89%,相比独立LLM的62.6%有显著提升,AI辅助工作流程任务完成速度快40%,并降低认知负荷。