Gemma模型如何帮助发现新的潜在癌症治疗通路

Google DeepMind Blog 模型

摘要

Google DeepMind与耶鲁大学发布了C2S-Scale,这是一个基于Gemma构建的270亿参数基础模型,用于单细胞分析,该模型发现了一种有前景的药物组合(silmitasertib和干扰素),可增强“冷”肿瘤的免疫可见性,其预测已通过实验验证。

我们正在推出一个新的270亿参数基础模型,用于单细胞分析,该模型基于Gemma开放模型家族构建。
查看原文
查看缓存全文

缓存时间: 2026/04/20 08:35

# Gemma 模型如何帮助发现新的潜在癌症治疗路径 来源:https://blog.google/innovation-and-ai/products/google-gemma-ai-cancer-therapy-discovery/ 我们正在推出一个基于 Gemma 开放模型系列构建的、用于单细胞分析的 270 亿参数基础模型。 Bryan Perozzi 高级研究员,图挖掘,Google Research ## 总体摘要 Google DeepMind 和耶鲁大学共同创建了 C2S-Scale,这是一个基于 Gemma 开放模型系列构建的新模型。该模型识别出一种药物组合,可能使肿瘤对免疫系统更可见,从而提供了一种新的癌症治疗方法。研究人员现在可以访问该模型和相关资源,在此基础上进行进一步研究。 摘要由 Google AI 生成。生成式 AI 处于实验阶段。 ## 要点 - 本文讨论了 C2S-Scale,这是一个帮助发现潜在癌症治疗路径的新 AI 模型。 - 基于 Google 的 Gemma,C2S-Scale 预测了一种药物组合,可以增强“冷”肿瘤中的免疫信号。 - 实验室测试证实了模型的预测:silmitasertib 和干扰素可放大抗原呈递。 - 这一发现为让肿瘤对免疫系统更可见提供了一种新方法。 - C2S-Scale 模型和相关资源现已提供给研究人员探索和在此基础上发展。 摘要由 Google AI 生成。生成式 AI 处于实验阶段。 #### 探索其他风格: 一张深蓝黑色抽象幻灯片,中心有一个大的、模糊的类细胞结构。文字“Cell2Sentence Scale 27B”为白色。右下角可见“Gemma”字样。 今天,作为我们与耶鲁大学 (https://www.vandijklab.org/) 研究合作的一部分,我们发布了 Cell2Sentence-Scale 27B (C2S-Scale) (https://www.biorxiv.org/content/10.1101/2025.04.14.648850),这是一个全新的 270 亿参数基础模型,旨在理解单个细胞的语言。C2S-Scale 基于 Gemma 开放模型系列 (https://deepmind.google/models/gemma/) 构建,代表了单细胞分析的新前沿。 这一宣布标志着 AI 在科学领域的一个里程碑。C2S-Scale 提出了一个关于癌细胞行为的新假设,我们随后通过活细胞实验验证了其预测。这一发现为开发抗击癌症的疗法揭示了一条有前景的新途径。 此次发布建立在我们今年早些时候的工作基础之上 (https://research.google/blog/teaching-machines-the-language-of-biology-scaling-large-language-models-for-next-generation-single-cell-analysis/),当时我们证明了生物模型遵循清晰的缩放定律——就像自然语言一样,更大的模型在生物学上表现更好。这项工作提出了一个关键问题:更大的模型只是更好地完成现有任务,还是能获得全新的能力?缩放的真正前景在于创造新想法和发现未知。 ### C2S-Scale 27B 的工作原理 癌症免疫疗法的一个主要挑战是许多肿瘤是“冷”的——免疫系统无法识别。让它们变“热”的关键策略是通过一种称为抗原呈递 (https://en.wikipedia.org/wiki/Antigen_presentation) 的过程,迫使它们显示触发免疫的信号。 艺术化展示“冷”的免疫环境中性肿瘤细胞,它们对免疫系统不可见;以及“热”的免疫环境阳性细胞,表面有更多可见抗原。 我们给新的 C2S-Scale 27B (https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B) 模型一个任务:找到一种作为*条件放大器*的药物,该药物*仅*在特定的“免疫环境阳性”环境中增强免疫信号。在这种环境中,已经存在低水平的干扰素(一种关键的免疫信号蛋白),但不足以自行诱导抗原呈递。这需要一定程度的条件推理,这似乎是缩放带来的涌现能力;我们较小的模型无法解决这种上下文依赖效应。 为了实现这一点,我们设计了一个*双背景虚拟筛选*来找到这种特定的协同效应。虚拟筛选包括两个阶段: 1. **免疫环境阳性:** 我们向模型提供了具有完整肿瘤-免疫相互作用和低水平干扰素信号的真实患者样本。 2. **免疫环境中性:** 我们向模型提供了没有免疫背景的分离细胞系数据。 然后,我们模拟了超过 4,000 种药物在两种背景下的效果,并要求模型预测哪些药物*仅*在第一种背景下增强抗原呈递,从而使筛选偏向于与患者相关的情况。在模型突出显示的众多候选药物中,有一小部分(10-30%)在已有文献中已知,而其余的药物是*令人惊讶的命中*,之前未发现与筛选相关。 ## 从预测到实验验证 模型的预测非常清晰。它识别出名为 silmitasertib (CX-4945) 的激酶 CK2 抑制剂存在显著的“背景分裂”。模型预测,在“免疫环境阳性”背景下使用 silmitasertib 时,抗原呈递会*增强*,但在“免疫环境中性”背景下几乎没有效果。这一预测之所以令人兴奋,是因为它是一个全新的想法。虽然 CK2 已被发现参与许多细胞功能,包括作为免疫系统的调节剂,但文献中尚未报道通过 silmitasertib 抑制 CK2 能明确增强 MHC-I 表达或抗原呈递。这凸显了模型正在生成新的、可检验的假设,而不仅仅是重复已知事实。 然而,预测只有在临床应用中能得到验证才有价值。真正的测试首先是在实验室,最终是在临床。 在我们项目的下一阶段,我们将这一假设带到实验室工作台,并在人类神经内分泌细胞模型(一种模型在训练期间完全未见过的细胞类型)中进行了测试。实验表明: - 单独用 silmitasertib 处理细胞对抗原呈递 (MHC-I) 没有影响。 - 单独用低剂量干扰素处理细胞有适度的效果。 - 同时用 silmitasertib 和低剂量干扰素处理细胞,产生了显著且协同的抗原呈递放大效应。 值得注意的是,在我们的实验室测试中,silmitasertib 和低剂量干扰素的组合使抗原呈递增加了约 50%,这将使肿瘤对免疫系统更可见。 模型的*计算机模拟*预测在*体外*被多次证实。C2S-Scale 成功识别出一种新的、干扰素依赖的条件放大器,揭示了一条让“冷”肿瘤变“热”的新潜在途径,并可能使肿瘤对免疫疗法更敏感。虽然这只是早期的第一步,但它为开发新的联合疗法(即同时使用多种药物以达到更强效果)提供了一个有力且经过实验验证的线索。 这一结果也为一种新型生物发现提供了蓝图。它表明,通过遵循缩放定律并构建像 C2S-Scale 27B 这样更大的模型,我们可以创建足够强大的细胞行为预测模型,用于进行高通量虚拟筛选、发现条件依赖的生物学现象,并生成有生物学基础的假设。 耶鲁大学的团队目前正在探索这里发现的机制,并在其他免疫背景下测试更多 AI 生成的预测。通过进一步的临床前和临床验证,这样的假设或许最终能够加速新疗法的开发路径。 ## 开始使用 C2S-Scale 27B 新的 C2S-Scale 27B 模型及其资源现已向研究社区开放。我们邀请您探索这些工具,在我们的工作基础上继续研究,帮助我们持续翻译生命的语言。 - 阅读 bioRxiv 上的完整科学预印本 (https://www.biorxiv.org/content/10.1101/2025.04.14.648850)。 - 在 Hugging Face 上探索模型和资源 (https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B)。 - 在 GitHub 上获取代码 (https://github.com/vandijklab/cell2sentence)。

相似文章

MedGemma:我们最强大的开源健康AI开发模型

Google DeepMind Blog

Google DeepMind 发布了 MedGemma 27B Multimodal 和 MedSigLIP,扩充了其开源 Health AI Developer Foundations,加入了用于医学文本和影像任务的高性能、保护隐私的模型。

推出 Gemma 3

Google DeepMind Blog

Google 推出了 Gemma 3,这是一套轻量级开源模型集合(1B、4B、12B、27B),设计用于在单个 GPU 或 TPU 上运行,支持 140+ 种语言、128k 上下文窗口和多模态功能。这些模型在保持高效性能的同时,性能超越了 Llama 3 和 DeepSeek-V3 等更大的竞品,适合边缘设备部署。