两款AI科学助手在药物重定位任务中取得成功

Ars Technica 工具

摘要

两款AI驱动的科学助手——谷歌的Co-Scientist和FutureHouse的Robin——能够生成假设并分析生物数据以进行药物重定位,帮助研究人员发现跨科学领域的非直观关联。

<p>周二,《自然》杂志发表了两篇论文,描述了旨在帮助科学家开发和测试假设的AI系统。其中一个是谷歌的Co-Scientist,它被设计成所谓的“科学家在环”,即研究人员定期运用判断来指导系统。另一个来自非营利组织FutureHouse,它更进一步,训练了一个能够评估来自特定实验类型的生物数据的系统。</p> <p>尽管谷歌表示其系统也适用于物理学,但两个团队都仅展示了生物数据,且多为直接了当的假设——这种药对这种病有效。因此,这并非试图取代科学家或科学过程,而是帮助发挥当前AI的最佳能力:处理人类难以应对的海量信息。</p> <h2>这对什么有帮助?</h2> <p>这两个系统之间存在一些差异,但都属于所谓的代理型;它们在后台运行,通过调用外部工具来工作。(微软也采用类似方法开发了其科学助手;OpenAI似乎是个例外,它只是<a href="https://arstechnica.com/science/2026/04/openai-starts-offering-a-biology-tuned-llm/">为生物学调整了LLM</a>。)而且,尽管我们将强调它们之间的差异,但两者都聚焦于同一个大致问题:科学信息的极度丰富。</p><p><a href="https://arstechnica.com/science/2026/05/two-ai-based-science-assistants-succeed-with-drug-retargeting-tasks/">阅读全文</a></p> <p><a href="https://arstechnica.com/science/2026/05/two-ai-based-science-assistants-succeed-with-drug-retargeting-tasks/#comments">评论</a></p>
查看原文
查看缓存全文

缓存时间: 2026/05/19 21:57

# 两款基于AI的科学助手成功完成药物重定位任务 来源:https://arstechnica.com/science/2026/05/two-ai-based-science-assistants-succeed-with-drug-retargeting-tasks/ 两款工具均能生成假设;其中一款还能进一步分析部分实验数据。 数字生成的抽象有机形状图像,带有数字 plexus 连接。 (https://cdn.arstechnica.net/wp-content/uploads/2026/05/GettyImages-2164333125.jpg) 在混乱的生物世界中寻找联系,是这些新工具的核心所在。图片来源:Andriy Onufriyenko (https://www.gettyimages.com/detail/photo/tech-to-green-transition-royalty-free-image/2164333125?phrase=biology) 在混乱的生物世界中寻找联系,是这些新工具的核心所在。图片来源:Andriy Onufriyenko (https://www.gettyimages.com/detail/photo/tech-to-green-transition-royalty-free-image/2164333125?phrase=biology) 周二,《自然》杂志发表了两篇论文,描述了旨在帮助科学家开发和检验假设的AI系统。其中一款是谷歌的Co-Scientist,被设计为所谓的“科学家循环”模式,即研究人员需不断运用自身判断来引导系统。第二款来自非营利组织FutureHouse,则更进一步,训练出了一个能评估来自特定类型实验的生物数据的系统。 尽管谷歌表示其系统也适用于物理学,但两个团队均只展示了生物学数据,且主要为直截了当的假设——这种药对这种病有效。因此,这并非试图取代科学家或科学过程,而是旨在帮助完成当前AI最擅长的任务:处理人类难以应对的海量信息。 ## 这有什么用处? 两个系统之间存在一些差异,但都属于所谓的“代理型”;它们在后台通过调用独立工具来运行。(微软在其科学助手中也采用了类似方法;OpenAI似乎是个例外,它只是对一个LLM进行了生物学微调 (https://arstechnica.com/science/2026/04/openai-starts-offering-a-biology-tuned-llm/)。)尽管我们将强调它们之间的差异,但两者都聚焦于同一个普遍问题:科学信息的极度泛滥。 随着在线出版的便利,期刊数量激增,论文数量也随之爆炸。任何研究人员想要跟上自己领域的进展都变得困难重重。发现其他领域的潜在相关材料更是真正的挑战。例如,如果你专注于眼睛发育,涉及的一个信号系统可能也与肾脏有关,而人们很容易错过关于该信号系统在肾脏方面的发现。 正如FutureHouse的人所言:“通过聚焦‘组合合成’(识别不同领域之间非显而易见的联系),Robin实际上瞄准了‘低垂的果实’——那些由于科学知识的分块化而可能被人类专家忽略的果实。” 这是一项非常适合AI的任务,它可以在研究人员做其他事情的同时,在后台消化经过同行评审的文献。这其实不是AI能否比人类做得更好或更差的问题,而是是否会有任何人类真正会去做这类搜索的问题。 通过在不同研究之间找到足够多的联系,这些工具可以提出关于生物学的建议——实际上就是假设。这可以包括诸如哪些过程构成了生物行为的基础,以及哪些通路和网络调节这些过程。在本文探讨的案例中,还包括推荐已知的药物,这些药物可能针对患病细胞中的某些通路:谷歌的案例是急性髓系白血病,而FutureHouse的案例是一种黄斑变性。 ## Co-Scientist 你可以想象,谷歌的系统基于该公司的Gemini大型语言模型。这有助于系统解释人类科学家提供的研究目标陈述,并开始文献搜索以查找相关信息并形成假设。然后,这些假设会在一个“锦标赛”中相互评估,评估结果由Reflection智能体分析。Evolution智能体随后可以对任何存活的思路进行改进,然后可以再次送入流程。 在整个过程中考虑的关键标准包括:合理性、新颖性、可检验性和安全性。Reflection工具可以访问外部搜索工具,因为访问科学文献“可以防止系统幻觉出看似新颖但实不合理的假设”,该公司写道。 正如论文所述,科学家始终在循环中。在寻找针对白血病的潜在药物时,系统提出的建议由一个专家小组根据对Co-Scientist用于形成建议的文献的查阅情况进行评审,从而确定优先级。 结果与人们对癌症疗法的预期一致。识别出的某些药物确实有效,但仅针对一组髓系白血病细胞中的部分亚型。这并不罕见,因为有多种途径导致不受控制的生长,因此阻断一种细胞类型所采用的途径的药物,可能对采用不同途径的细胞无效。 谷歌还提到,该系统可以进行更通用的、不涉及药物的假设生成,并以细菌中毒力基因的传播为例。但该工作的细节相当简略。 该系统还设置为模型无关,以便随着AI系统的进化切换到性能更优的模型。但他们也警告说:“Co-Scientist也会继承其底层模型的内在局限,包括事实性不完善和可能出现幻觉。” ## 而Robin FutureHouse的系统有一些相似之处,但存在几个关键差异,这些差异不仅仅在于将所有代理型工具都以鸟类命名。主系统Robin可以访问专门的文献搜索工具。其中一个是Crow,它提供论文的简洁摘要;而Falcon则给出论文所含信息的深入概述。描述该系统的论文清晰地展示了这里的优势:“Robin在30分钟内分析了551篇论文,而人类估计需要540小时。” 利用这些摘要,Robin接着形成了一系列关于黄斑变性疾病机制的假设,并使用这些工具为每种机制提供详细的证据报告。然后,一个LLM裁判对这些假设进行两两比较,得出相对排名——这有点像谷歌的锦标赛系统。 以类似的方式,该系统还被重新部署,以建议能够作为黄斑变性模型的细胞系和培养条件,并准备了关于30种候选药物的报告。“这些报告既包括每种药物为何适合缓解体外模型所代表的疾病机制的论证,也包括该药物可能带来的潜在局限性,”FutureHouse团队表示。同样,这些报告由人类专家评估以决定进行哪些测试。 Robin还建议了测试药物的分析方法,由人类进行评估(在大多数情况下,他们似乎使用了建议方法的变体)。 Robin的关键区别在于它包含一个名为Finch的工具,该工具可以自动化评估来自某些标准生物筛选分析(如流式细胞术和RNA-seq)的数据。因此,只要你的测试涉及Finch能处理的分析方法,那么就可以由系统执行额外的步骤。 如上所述,Robin提出了一个新颖的假设:增强视网膜细胞清除细胞外碎片的能力,或许能为疾病提供一定保护。并且它识别出一种似乎能在其提议的实验中提供此类增强的药物。 正如谷歌所发现的,专门设计用于与科学文献交互的工具至关重要。将Crow换成OpenAI的o4-mini后,幻觉引用的比率从0%一口气上升到了45%。FutureHouse还检查了OpenAI研究聚焦工具的性能,发现所有该工具建议但Robin未提及的药物,均对这些细胞无效。 ## 这给我们带来了什么? 首先,值得注意的是,这些成功发生在药物开发中相对容易的环节(尽管不能说任何环节真的容易)。AI没有被要求设计全新的分子,而且大多数药物是在动物和临床试验阶段失败的,而不是在细胞培养测试阶段。这并不是说现有药物的再利用无关紧要——我们已经有了这些分子的安全档案和机构批准,而且许多已过专利期,因此成本低廉。但我们尚未达到AI能解决硬问题的地步。 这类假设——这种机制导致那种疾病,那种药物可以靶向它——也是生物学中较为具体的假设形式。在我作为科学家的职业生涯中,我不得不提出旨在解决此类问题的假设:“携带这种突变的小鼠在非常不同的组织中存在大量缺陷;是否存在一个单一的潜在机制?”或者“这个基因表达的边界处发生了什么,从而改变了细胞对这种信号分子的反应?”尚不清楚这些系统如何处理这些更开放的科学问题。 话虽如此,文献超载问题在许多领域真实存在,旨在解决它的系统可以帮助我们避免出现这种情况:我们所需的所有信息都闲置了十年,却没有人把它们整合起来。然而,考虑到我们仍处于AI的成长阵痛期,我也很高兴至少有两条独立开发的系统在解决这个问题,这样我们或许可以同时运行两者并比较结果。 Nature, 2026. DOI:10.1038/s41586-026-10652-y (http://dx.doi.org/10.1038/s41586-026-10652-y), /10.1038/s41586-026-10644-y (http://dx.doi.org//10.1038/s41586-026-10644-y) (关于DOI (http://arstechnica.com/science/news/2010/03/dois-and-their-discontents-1/)) John Timmer的肖像 (https://arstechnica.com/author/john-timmer/) John是Ars Technica的科学编辑。他在哥伦比亚大学获得生物化学学士学位,并在加州大学伯克利分校获得分子与细胞生物学博士学位。当不坐在键盘前时,他倾向于骑上自行车,或寻找一个风景优美的地方,与他的登山靴相伴。 5条评论 (https://arstechnica.com/science/2026/05/two-ai-based-science-assistants-succeed-with-drug-retargeting-tasks/#comments) 1. “最热阅读”中第一篇故事的配图:埃博拉疫情:WHO宣布紧急状态,美国限制旅行,一名美国人感染 (https://arstechnica.com/health/2026/05/ebola-outbreak-who-declares-emergency-us-restricts-travel-american-infected/)

相似文章

AI智能体团队加速研究速度

Reddit r/artificial

使用智能体团队的AI系统,如谷歌的Co-Scientist和FutureHouse的Robin,可以在数小时内而不是数月内加速药物再利用研究,通过提出假设、设计实验和分析数据。

Generating novel scientific hypotheses with Co-Scientist

YouTube AI Channels

Google DeepMind's Co-Scientist is a multi-agent AI system that acts as a virtual team of scientists to search literature, generate hypotheses, and design experiments, compressing months of research into days and already yielding new scientific discoveries.

整合生物工具包,探索ALS新疗法

Google DeepMind Blog

DeepMind的Co-Scientist人工智能工具融合了两位来自不同生物领域研究者的专业知识,通过生成可验证的假设并识别基于RNA的潜在治疗机制,加速ALS研究。