迈向虚拟细胞中的自主机制推理

Hugging Face Daily Papers 论文

摘要

本文介绍了VCR-Agent,一个多智能体框架,通过结构化形式化和VC-TRACES数据集生成并验证机制性解释,从而增强大型语言模型在生物学研究中的应用。该方法通过虚拟细胞中的验证性机制推理,提高了基因表达预测的事实准确性。

大型语言模型(LLMs)近期作为加速科学发现的一种有前景的途径而备受关注。然而,它们在生物学等开放性科学领域中的应用仍然有限,这主要是由于缺乏基于事实且可操作的解释。为解决这一问题,我们为虚拟细胞引入了一种结构化解释形式化方法,将生物学推理表示为机制动作图,从而支持系统性的验证与证伪。在此基础上,我们提出了VCR-Agent,一个多智能体框架,它结合了基于生物学知识的知识检索和验证器过滤方法,能够自主生成和验证机制性推理。利用该框架,我们发布了VC-TRACES数据集,其中包含源自Tahoe-100M图谱的经过验证的机制性解释。实验表明,使用这些解释进行训练能提高事实精确度,并为下游基因表达预测提供更有效的监督信号。这些结果强调了通过多智能体与严格验证的协同作用,实现虚拟细胞中可靠机制推理的重要性。
查看原文
查看缓存全文

缓存时间: 2026/04/20 08:28

论文页面 - 迈向虚拟细胞中的自主机制推理

来源:https://huggingface.co/papers/2604.11661

摘要

大型语言模型通过多智能体框架得到增强,该框架利用结构化形式化方法和经过验证的数据集,生成并验证机制性解释,从而推动生物学研究。

大型语言模型(https://huggingface.co/papers?q=Large%20language%20models)(LLMs)近期作为加速科学发现的有前景方法而备受关注。然而,它们在生物学等开放式科学领域的应用仍受到限制,主要原因是缺乏事实依据充分且可操作的解释。为解决此问题,我们引入了一种针对虚拟细胞(https://huggingface.co/papers?q=virtual%20cells)的结构化解释形式化方法,将生物推理表示为机制性动作图(https://huggingface.co/papers?q=mechanistic%20action%20graphs),从而实现系统性的验证与证伪。在此基础上,我们提出了VCR-Agent,这是一个多智能体框架(https://huggingface.co/papers?q=multi-agent%20framework),将基于生物学知识的检索(https://huggingface.co/papers?q=biologically%20grounded%20knowledge%20retrieval)与基于验证器的过滤(https://huggingface.co/papers?q=verifier-based%20filtering)方法相结合,自主生成并验证机制性推理(https://huggingface.co/papers?q=mechanistic%20reasoning)。利用该框架,我们发布了VC-TRACES数据集(https://huggingface.co/papers?q=VC-TRACES%20dataset),该数据集包含从Tahoe-100M图谱(https://huggingface.co/papers?q=Tahoe-100M%20atlas)中提取的经过验证的机制性解释。实验表明,使用这些解释进行训练可提高事实准确性,并为下游基因表达预测(https://huggingface.co/papers?q=gene%20expression%20prediction)提供更有效的监督信号。这些结果强调了可靠机制性推理(https://huggingface.co/papers?q=mechanistic%20reasoning)对虚拟细胞(https://huggingface.co/papers?q=virtual%20cells)的重要性,这通过多智能体与严格验证的协同作用得以实现。

查看arXiv页面(https://arxiv.org/abs/2604.11661)查看PDF(https://arxiv.org/pdf/2604.11661)项目页面(https://valencelabs.substack.com/p/towards-reasoning-in-virtual-cells)GitHub4(https://github.com/valence-labs/VCR-Agent)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2604.11661)

在你的智能体中获取此论文:

hf papers read 2604\.11661

没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型链接此论文

在模型README.md中引用 arxiv.org/abs/2604.11661 即可在此页面链接它。

引用此论文的数据集0

没有数据集链接此论文

在数据集README.md中引用 arxiv.org/abs/2604.11661 即可在此页面链接它。

引用此论文的Space0

没有Space链接此论文

在Space README.md中引用 arxiv.org/abs/2604.11661 即可在此页面链接它。

包含此论文的收藏集0

没有包含此论文的收藏集

将此论文添加到收藏集(https://huggingface.co/new-collection)即可在此页面链接它。

相似文章

从残差到推理:基于LLM的表格数据机制推断

arXiv cs.LG

介绍了多智能体残差上下文学习(MARICL),这是一种智能体框架,利用LLM智能体分析基础模型在表格数据上的残差,假设缺失的结构,并通过文本梯度优化产生显式的修正项。在九个基准测试中,MARICL持续优于其基础模型,并在无细胞蛋白质预测中展示了机制泛化能力。

AgentV-RL:用智能体验证器扩展奖励建模

arXiv cs.CL

AgentV-RL引入了智能体验证器框架,通过具有工具增强的前向和后向智能体进行双向验证来增强奖励建模,相比最先进的ORM实现了25.2%的性能提升。该方法通过将多轮深思熟虑过程与强化学习相结合,解决了验证器在复杂推理任务中的误差传播和基础性不足等问题。