GPT-Rosalind 新增功能发布

OpenAI Blog 2026/06/03 13:15 模型

gpt-rosalind life-sciences drug-discovery medicinal-chemistry genomics benchmark openai

摘要

OpenAI 推出了专为生命科学研究设计的更新版 GPT-Rosalind 模型，在药物化学、基因组学和药物发现流程方面性能提升，并引入了 LifeSciBench 和 MedChemBench 等新基准。

GPT-Rosalind 凭借增强的生物推理能力、药物化学专业知识、基因组学分析以及实验工作流程能力，推动了生命科学研究的进步。

查看原文

查看缓存全文

缓存时间: 2026/06/03 21:42

# 为 GPT-Rosalind 引入全新功能来源：https://openai.com/index/introducing-new-capabilities-to-gpt-rosalind/ 我们正在为专为生命科学研究而打造的 GPT-Rosalind (https://openai.com/gpt-rosalind/) 系列推出新的模型更新。它结合了 GPT-5.5 的智能编码和工具使用能力，以及在药物化学、基因组学等核心药物发现领域更强的模型智能，同时提升了在更广泛的生命科学分析、设计和实验工作流中的性能。生命科学的进步依赖于跨尺度、多模态的数据与证据整合：分子、基因、通路以及生命系统。我们的评估显示，更新后的 GPT-Rosalind 在生物学专家研究任务、复杂药物化学查询、定量生物学以及湿实验故障排除方面均展现出广泛的性能提升。 GPT-Rosalind 现通过我们的可信访问部署结构，面向全球符合条件的组织提供研究预览。 ## 在具有科学价值的任务上提升性能为了衡量并持续提升 GPT-Rosalind 的实际影响力，我们设计了 LifeSciBench。这是一个由外部专家评审的基准测试，专注于生命科学研究的基础方面。与现有只评估模型性能单一环节或孤立生物学领域的基准不同，LifeSciBench 采用端到端视角，从生命科学研究的六个核心工作流领域（证据处理、分析、设计与优化、科学推理、验证与操作、转化与沟通）提取任务，从而将进展与生命科学研究的需求和现实对齐。 GPT-Rosalind 在行业和学术专家确定的科学价值任务上领先性能。从论文、图表、表格和实验记录中提取、核对和审计科学证据。 ## 评测示例 ## 候选回复 ## 评分标准与等级识别微肌萎缩蛋白定量中的检测/测量问题，包括 MANEX1A 表位共享、无效的全长抗肌萎缩蛋白标准品，以及需要重组或正交转基因特异性测量。 +24 解释为何微肌萎缩蛋白表达水平本身并不自动成为功能性临床获益的有效替代指标。 +22 指出活检部位、组织构成和年龄窗口的混杂因素削弱了表达和 NSAA 解释的效力。 +19 批评 NSAA 比较器/统计学方法，特别是依赖外部自然病史对照组。 +12 涉猎 AAV 持久性、免疫反应、转氨酶升高、心肌炎，以及需要更长期的表达/安全性随访。 +15 指出患者选择/普适性不足，包括抗 AAV9 排除标准、exon-44 排除标准以及样本量偏小。 +8 ## 更强的科学推理能力 GPT-Rosalind 在药物化学领域实现了业界领先的性能。该领域专注于将分子转化为有用的药物。我们设计了 MedChemBench 来反映真实的药物化学工作流，评估多模态化学结构理解、构效关系 (SAR)、药物效力、毒性和吸收、分布、代谢、排泄 (ADME) 预测、多参数先导化合物优化决策以及逆合成分析。GPT-Rosalind 在 MedChemBench 上以 27.5% 优于 GPT-5.5 的 25.1%，同时 token 使用量减少 7.2%。 GPT-Rosalind 在药物化学领域展现出更好的多模态合成和机理推理能力。在 GeneBench（我们在基因组学和定量生物学领域的端到端长周期智能体评估）上，GPT-Rosalind 相比 GPT-5.5 token 使用量减少 31%，同时准确率从 20.4% 提升至 21.6%。GeneBench 评估智能体在长周期定量任务上的性能：基于真实的科学数据，智能体能否规划有效的分析、质量控制、建模和修正，以得出与决策相关的答案？涵盖的问题跨越多个领域，包括功能基因组学、空间转录组学、蛋白质组学、表观基因组学和应用遗传学。 GPT-Rosalind 在提升准确率的同时，token 使用量比 GPT-5.5 减少 31%。我们引入了一项新的评估，用于测试 GPT-Rosalind 在帮助科学家进行真实世界实验室工作方面的能力。LabWorkBench 测试模型将扰动与真实湿实验方案中的实验结果联系起来的能力，范围涵盖故障排除到优化。LabWorkBench 使用的数据是专有的，因此未被污染。GPT-Rosalind 得分为 63.2%，GPT-5.5 为 55.8%，同时 token 使用量减少 5.3%。在真实的湿实验方案辅助上，GPT-Rosalind 相比 GPT-5.5 有显著提升，同时提高了 token 效率。 ## 从推理到执行工作流我们构建了生命科学研究 (https://github.com/openai/plugins/tree/main/plugins/life-science-research) 和生命科学 NGS 分析 (https://github.com/openai/plugins/tree/main/plugins/ngs-analysis) 这两个插件，为 GPT-Rosalind (https://openai.com/gpt-rosalind/) 增强的智能提供了实用的执行层，用于可重复的科学工作流。这些插件共同将来源证据检索、生物学解释和生物信息学执行整合到同一工作区，帮助研究人员将外部证据与内部组学分析连接起来，同时保留产物和溯源信息。所有用户现在都可以通过 Codex 访问这两个插件。符合条件的 GPT-Rosalind 企业用户还可以使用 GPT-Rosalind 来驱动这些插件。为了更好地利用 Codex 作为科学家的动态工作台，我们增加了针对生物学原生文件类型的交互式查看器。初始的序列、比对和结构查看器旨在让科学家在处理工作流时紧贴证据，并利用活动查看器的上下文直接回答后续问题。上述演示展示了这些能力在 GPT-Rosalind 协调下的实际应用。我们跟随一位科学家调查液体肿瘤活检，以识别可能指导治疗的突变和其他分子变化。Life Sciences NGS Analysis 插件将已处理 ctDNA 记录的审查转变为交互式笔记本，揭示反复出现的变异、低频检出和样本轨迹，将调查重点集中于 KRAS G12C。接着，Life Sciences Research 插件增加了带来源的靶点、抑制剂和耐药性背景信息，而原生的序列、比对和结构查看器则允许科学家直接检查突变残基 12、其在 RAS 家族中的保守性以及抑制剂结合口袋。该流程最终将这些证据转化为具体的后续可选方案，每一步和每个产物均可供专家审核。一个电脑屏幕显示了一个工作区，指示使用 NGS Analysis 插件探索 ctDNA 突变数据。屏幕包含几个柱状图，分别标注为“Top detailed histologies”和“Top altered genes by mutated cfDNA samples”，显示癌症类型和基因改变的数据。文本描述了数据集、主要发现和分析参数。 Life Sciences NGS Analysis 插件 scRNA-seq QC 与注释一个分屏生物信息学工作流的截图。左侧面板显示 AI 助手总结已完成单细胞 RNA 测序质控分析的结果，包括生成的文件、QC 指标、UMAP 可视化和细胞类型注释。右侧面板显示一份“scRNA QC Review”报告，包含总计数、检测基因和线粒体百分比的直方图，以及显示 QC 通过/失败计数和过滤后细胞群体的柱状图。界面显示在蓝绿渐变背景上。将一个 10x 风格的矩阵数据包转换为经过 QC 过滤的单细胞产物、注释和 UMAP，可在 Codex 中检查并修改。Life Sciences NGS Analysis 插件将请求路由到 scrna-seq-qc，根据数据选择 QC 阈值，保留关于过滤和注释的溯源信息，并提示诸如缺失双细胞检测依赖等阻塞点。一个 RNA-seq 工作流的分屏视图：左侧是 AI 助手总结已完成批量 RNA-seq 质控结果，右侧是交互式 MultiQC 报告，显示测序统计数据和 Salmon 指标。将批量 RNA-seq 样本表、FASTQ 数据包和参考文件转换为经过 QC 审查的计数数据包，可在 Codex 中检查并重复使用。Life Sciences NGS Analysis 插件路由请求、验证输入，并返回一个可审计的运行包，包含 MultiQC、Salmon 矩阵、溯源信息和明确的注意事项。 ## 扩大对可信组织的访问我们正在扩大 GPT-Rosalind (https://openai.com/gpt-rosalind/) 系列对全球符合条件的组织的访问。GPT-Rosalind 将通过我们的可信访问部署结构以研究预览形式提供，面向那些从事具有明确公共效益的合法科学研究、具备强大治理和安全监督能力、并通过企业级安全进行受控访问的组织。作为本次全球扩展的一部分，我们很高兴能够支持 Novo Nordisk 的使命，即更快地为患者带来创新治疗方案，通过 GPT-Rosalind 帮助扩展其医学研究规模。Novo Nordisk 正利用前沿 AI 能力帮助研究人员分析复杂数据集、发现有用模式并更快地检验假设。GPT-Rosalind 更强的生物学理解将帮助团队连接文献、基因组学、转录组学、序列、结构和实验结果中的证据，使从数据到更清晰的研究决策变得更容易。 “生命科学研究是复杂、数据丰富且跨学科的。为了向研究人员提供有意义的价值，先进 AI 模型必须基于可信的科学数据，连接经过验证的工具，并整合到研究人员日常使用的真实工作流中。我们对与 OpenAI 的合作以及探索 GPT-Rosalind 如何支持更严谨、更实用的药物发现方法的机会感到满意。” Mishal Patel，诺和诺德研发部 AI 与数字创新集团副总裁我们现在还为没有企业账户的合格组织提供 OpenAI 管理的工作区。 ## 下一步计划更新后的 GPT-Rosalind 是我们更广泛承诺的下一步，即构建能够加速科学发现，同时确保先进生物能力在适当保护措施下部署的 AI 系统。我们将继续改进模型的生物学推理能力，扩展对工具密集型、长周期研究工作流的支持，并与各地区的合格组织合作评估实际影响力。这也意味着将生命科学 AI 应用于高影响力的公共利益工作，从药物发现和转化医学到公共卫生、防范和生物防御。通过 Rosalind Biodefense (https://openai.com/index/strengthening-societal-resilience-with-rosalind-biodefense/) 以及我们的可信访问部署模型，我们旨在将前沿生物能力交到那些致力于改善人类健康、增强社会韧性的研究人员、机构和防御者手中。我们将继续构建 GPT-Rosalind (https://openai.com/gpt-rosalind/)，使其成为贯穿科学研究整个生命周期的更有能力的伙伴，帮助科学家更快速地从正确的问题转向更清晰的证据、更好的实验，并最终为患者带来新的治疗方法。

GPT-Rosalind 新增功能发布

相似文章

推出用于生命科学研究的 GPT-Rosalind

@OpenAI: GPT-Rosalind，我们的生命科学模型系列，针对科学工作流进行了优化，在蛋白质推理、化学分析、基因组学及科学工具使用方面表现更佳。

@OpenAI: 推出 GPT-Rosalind，我们的前沿推理模型，旨在支持生物学、药物发现及转…

设计更快速的生命科学实验

将零散证据转化为生命科学发现决策

提交意见反馈