迈向虚拟细胞中的自主机制推理
摘要
本文介绍了VCR-Agent,一个多智能体框架,通过结构化形式化和VC-TRACES数据集生成并验证机制性解释,从而增强大型语言模型在生物学研究中的应用。该方法通过虚拟细胞中的验证性机制推理,提高了基因表达预测的事实准确性。
查看缓存全文
缓存时间: 2026/04/20 08:28
论文页面 - 迈向虚拟细胞中的自主机制推理
来源:https://huggingface.co/papers/2604.11661
摘要
大型语言模型通过多智能体框架得到增强,该框架利用结构化形式化方法和经过验证的数据集,生成并验证机制性解释,从而推动生物学研究。
大型语言模型(https://huggingface.co/papers?q=Large%20language%20models)(LLMs)近期作为加速科学发现的有前景方法而备受关注。然而,它们在生物学等开放式科学领域的应用仍受到限制,主要原因是缺乏事实依据充分且可操作的解释。为解决此问题,我们引入了一种针对虚拟细胞(https://huggingface.co/papers?q=virtual%20cells)的结构化解释形式化方法,将生物推理表示为机制性动作图(https://huggingface.co/papers?q=mechanistic%20action%20graphs),从而实现系统性的验证与证伪。在此基础上,我们提出了VCR-Agent,这是一个多智能体框架(https://huggingface.co/papers?q=multi-agent%20framework),将基于生物学知识的检索(https://huggingface.co/papers?q=biologically%20grounded%20knowledge%20retrieval)与基于验证器的过滤(https://huggingface.co/papers?q=verifier-based%20filtering)方法相结合,自主生成并验证机制性推理(https://huggingface.co/papers?q=mechanistic%20reasoning)。利用该框架,我们发布了VC-TRACES数据集(https://huggingface.co/papers?q=VC-TRACES%20dataset),该数据集包含从Tahoe-100M图谱(https://huggingface.co/papers?q=Tahoe-100M%20atlas)中提取的经过验证的机制性解释。实验表明,使用这些解释进行训练可提高事实准确性,并为下游基因表达预测(https://huggingface.co/papers?q=gene%20expression%20prediction)提供更有效的监督信号。这些结果强调了可靠机制性推理(https://huggingface.co/papers?q=mechanistic%20reasoning)对虚拟细胞(https://huggingface.co/papers?q=virtual%20cells)的重要性,这通过多智能体与严格验证的协同作用得以实现。
查看arXiv页面(https://arxiv.org/abs/2604.11661)查看PDF(https://arxiv.org/pdf/2604.11661)项目页面(https://valencelabs.substack.com/p/towards-reasoning-in-virtual-cells)GitHub4(https://github.com/valence-labs/VCR-Agent)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2604.11661)
在你的智能体中获取此论文:
hf papers read 2604\.11661
没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有模型链接此论文
在模型README.md中引用 arxiv.org/abs/2604.11661 即可在此页面链接它。
引用此论文的数据集0
没有数据集链接此论文
在数据集README.md中引用 arxiv.org/abs/2604.11661 即可在此页面链接它。
引用此论文的Space0
没有Space链接此论文
在Space README.md中引用 arxiv.org/abs/2604.11661 即可在此页面链接它。
包含此论文的收藏集0
没有包含此论文的收藏集
将此论文添加到收藏集(https://huggingface.co/new-collection)即可在此页面链接它。
相似文章
VAKRA 深度解析:智能体的推理、工具使用与失效模式
本文介绍 VAKRA,一个用于评估企业级环境中 AI 智能体推理与工具使用能力的可执行基准。文章分析了各类失效模式,并详细阐述了该基准涉及 API 链式调用与文档检索的结构设计。
CP-Agent: 面向化学扰动下细胞形态轮廓分析的情境感知多模态推理
CP-Agent 是一个多模态大语言模型,它利用情境感知对齐(CP-CLIP)来解释化学扰动下的细胞形态变化,从而为药物发现提供可解释且可扩展的表型筛选。
从残差到推理:基于LLM的表格数据机制推断
介绍了多智能体残差上下文学习(MARICL),这是一种智能体框架,利用LLM智能体分析基础模型在表格数据上的残差,假设缺失的结构,并通过文本梯度优化产生显式的修正项。在九个基准测试中,MARICL持续优于其基础模型,并在无细胞蛋白质预测中展示了机制泛化能力。
AgentV-RL:用智能体验证器扩展奖励建模
AgentV-RL引入了智能体验证器框架,通过具有工具增强的前向和后向智能体进行双向验证来增强奖励建模,相比最先进的ORM实现了25.2%的性能提升。该方法通过将多轮深思熟虑过程与强化学习相结合,解决了验证器在复杂推理任务中的误差传播和基础性不足等问题。
VFEAgent: 一种用于端到端自动化有限元分析的多模态智能体框架
本文提出了VFEAgent,一种通过将视觉语言模型与验证优先的代码合成框架相结合来自动化有限元分析的多智能体系统,实现了从图像和问题描述到端到端模拟。