GPT-5降低无细胞蛋白质合成成本

OpenAI Blog 新闻

摘要

GPT-5通过与Ginkgo Bioworks的云端实验室进行闭环实验,展示了无细胞蛋白质合成(CFPS)成本降低40%的效果。该实验测试了超过36,000种独特的反应组成,并仅通过三轮优化就实现了新颖且稳健的配方。

一个结合了OpenAI的GPT-5和Ginkgo Bioworks云端自动化的自主实验室,通过闭环实验将无细胞蛋白质合成成本降低了40%。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 14:52

# GPT-5 降低无细胞蛋白合成成本 来源:https://openai.com/index/gpt-5-lowers-protein-synthesis-cost/ 我们在数学和物理等领域看到了人工智能的快速进步(https://openai.com/index/accelerating-science-gpt-5/),这些领域的想法通常可以在不接触物理世界的情况下进行评估。生物学则不同。进步离不开实验室,科学家们需要在其中进行耗时且昂贵的实验。 这种情况正在改变。前沿模型现在可以直接连接实验室自动化系统,提出实验方案,大规模运行实验,从结果中学习,并决定下一步做什么。在生命科学的许多领域,瓶颈在于迭代速度,而自主实验室的建立正是为了消除这一约束。 在先前的工作中,我们展示了 GPT-5 能够通过闭环实验改进湿实验室方案(https://openai.com/index/accelerating-biological-research-in-the-wet-lab/)。在此,我们展示相同的方法能够降低蛋白质生产成本。 我们与 Ginkgo Bioworks\(在新窗口中打开\)(https://www.ginkgo.bio/)合作,将 GPT-5 连接到一个云端实验室——这是一个通过软件远程运行的自动化湿实验室,由机器人执行实验并返回数据——并利用这个实验室参与循环的设置,优化了一个广泛应用的生物学过程:无细胞蛋白合成(CFPS)。经过六轮闭环实验,该系统在 580 个自动化板上测试了超过 36,000 种独特的 CFPS 反应组合。在获得计算机、网页浏览器和相关论文的访问权限后,GPT-5 仅用三轮实验就建立了低成本 CFPS 的新基准,实现了蛋白质生产成本降低 40%(以及试剂成本改善 57%),其中包括对自主实验室常见反应条件更具鲁棒性的新型反应组合。 无细胞蛋白合成(CFPS)是一种无需培养活细胞即可制造蛋白质的方法。它不将 DNA 放入细胞并等待其产生蛋白质,而是在受控的混合物中运行蛋白质制造机制。这使得它成为快速原型设计和测试的实用工具,因为科学家可以快速运行大量实验,并在当天得到结果。 蛋白质是现代生物学成果的重要组成部分。许多重要药物基于蛋白质,许多诊断和研究检测也依赖于蛋白质。在工业环境中,蛋白质作为酶,使化学过程更清洁、更高效。甚至你的洗衣粉中也含有蛋白质。当蛋白质生产变得更快、更便宜时,科学家通常可以更早地测试更多想法,并降低将早期研究转化为人们日常受益产品的成本。 对于这种迭代,CFPS 已经很有用。瓶颈在于其优化难度大,且大规模应用时成本高昂。 无细胞蛋白合成需要复杂且相互作用的成分:编码目标蛋白质的 DNA 模板、细胞裂解液(细胞内机制的混合物),以及从能量来源到盐类的大量生化组分。从整体上推理这一系统极为困难,许多\(在新窗口中打开\)(https://pubmed.ncbi.nlm.nih.gov/21520017/)先前\(在新窗口中打开\)(https://www.nature.com/articles/s41467-020-15798-5?utm_source=chatgpt.com)的研究\(在新窗口中打开\)(https://www.nature.com/articles/s41467-025-58139-0?utm_source=chatgpt.com)已经应用了不同类型的机器学习来降低蛋白质生产成本。 标准的无细胞蛋白合成(CFPS)配方和商业试剂盒通常定价适用于人工操作节奏。自主实验室可以在人类团队运行几十个反应的时间内运行数千个反应。在这样的规模下,试剂成本成为限制因素。 仅凭直觉优化 CFPS 也很困难。它是一个由许多相互作用成分组成的混合物。微小的变化可能很重要,但效果的方向并不总是显而易见,而且不进行大量实验就很难找到最佳组合。先前的尝试已经降低了成本,但进展往往是渐进的,因为全面探索这个空间非常耗费人力。 我们将 GPT-5 与 Ginkgo Bioworks 的云端实验室配对,形成了一个用于无细胞蛋白合成(CFPS)优化的闭环自主系统。 GPT-5 设计了一批批实验。云端实验室执行了这些实验。结果反馈给模型。模型利用这些数据提出下一轮实验。我们重复了这个循环六次。 *GPT-5 以标准的 384 孔板格式设计了一批批实验,并在 Ginkgo Bioworks 的云端实验室上运行。实验完成后,云端实验室将数据推回给 GPT-5,模型分析结果,生成新假设,并设计下一轮实验。* 为了确保循环始终基于自主实验室的实际能力,我们在任何实验运行前都添加了严格的程序化验证。该验证确保 AI 设计的实验在自动化平台上在物理上是可执行的。它阻止了那些在文字上看起来合理但无法在机器人工作流程中实施的“纸上实验”。 在整个运行过程中,该系统在 580 个自动化板上执行了超过 36,000 个 CFPS 反应。这种规模很重要,因为它能让模式浮现出来。在生物学中,单个实验是有噪声的。吞吐量和迭代是将信号与随机噪声区分开来的方法。一旦 GPT-5 获得了相关论文和工具的访问权限,它仅用三轮实验和两个月的时间就建立了一个新的基准:蛋白质生产成本比最佳先前基线\(在新窗口中打开\)(https://www.biorxiv.org/content/10.1101/2025.08.01.668204v1.article-info)降低了 40%。 *Ginkgo Bioworks 的可重构自动化推车。图片来源:Ginkgo Bioworks* 我们发现,改进来自于识别出能够良好协同工作,并且在高通量自动化的实际条件下仍然有效的组合。 我们发现 GPT-5 确定了人类此前未以这种方式测试过的低成本反应组合。无细胞蛋白合成(CFPS)已被研究多年,但可能的混合空间仍然很大。当你可以快速提出并执行数千种组合时,就能找到那些在人工工作流程中容易被忽略的有效区域。 我们还发现,基于高通量板的实验通常与手动台面实验不同。在高通量反应格式中,氧化程度可能更低。混合和几何形状也可能不同。大多数 CFPS 反应在试管中产生的蛋白质远多于在微量滴定板中,因为更大的规模通常带来更多的氧气可用性和更好的混合。实际上,对于低体积的基于板的反应,GPT-5 在获得计算机用于数据分析和网页浏览器搜索相关论文后,立即提出了许多优于先前最佳性能的反应。总体而言,GPT-5 提出了许多在高通量约束下表现良好的试剂组合,包括许多在自动实验室常见的低氧条件下更具鲁棒性的组合。 此外,我们发现缓冲液、能量再生组分和多胺的微小变化对成本的影响远大于其自身成本。这些不总是人们首先考虑的参数,但在高通量下,它们变成了可检验的假设,而不是背景假设。 最后,成本结构本身也决定了什么最重要。在 CFPS 中,成本目前主要由裂解液和 DNA 主导。这意味着产量是最高杠杆的策略。如果你能提高每单位昂贵输入的蛋白质输出,即使在其他方面追求边际节省之前,也能在成本上取得有意义的进展。 *经过六轮自主实验,系统稳步改善了无细胞蛋白合成,降低了成本同时提高了蛋白质产量。结果以每轮实验的反应成本与蛋白质滴度显示,最佳权衡形成了一条边界。较大的点标记每轮达到的最低每克成本,星号/虚线参考表示在 384 孔板中的先前最先进基准(Olsen 等,2025 年)。对后续轮次的更仔细观察突出了最终的增益,逐轮总结显示最佳每克成本随时间降低。* 这些结果仅在一种蛋白质 sfGFP 和一个无细胞蛋白合成(CFPS)系统上展示。对其他蛋白质和其他 CFPS 系统的泛化仍需证明。 氧化和反应几何形状会强烈影响产量,这些因素在不同规模下可能不同。一些改进可能对这些条件敏感,理解这些敏感性是下一步工作的一部分。 方案改进和试剂处理需要人工监督。该系统可以设计和解释实验,但实验室工作仍然涉及需要经验丰富的操作员处理的实际细节。 我们计划将实验室参与循环的优化应用于其他生物学工作流程,在这些流程中更快的迭代可以带来进展。我们将自主实验室视为模型的补充。模型可以生成设计,但生物学最终仍需要测试和迭代。闭合生成与实验之间的循环是将有希望的想法转化为有效结果的方法。 在安全负责地加速科学进步的同时,我们也寻求评估和降低风险,特别是与生物安全相关的风险。这些结果表明,模型可以在湿实验室中进行推理以改进方案,并可能对生物安全产生影响,我们通过我们的防范框架(https://openai.com/index/updating-our-preparedness-framework/)进行评估和缓解。我们致力于在模型和系统层面建立必要且细致的防护措施以减少这些风险,并开发评估来跟踪当前水平。 我们感谢我们在 Ginkgo Bioworks 的合作伙伴以及帮助设计、运行和支持这项工作背后自动化云端实验室的团队。

相似文章

加速生命科学研究

OpenAI Blog

OpenAI 与 Retro Biosciences 合作开发了 GPT-4b micro,这是 GPT-4o 的专门版本,用于蛋白质工程,实现了干细胞重编程标志物表达提高 50 倍,并增强了 DNA 损伤修复能力。这些发现已在多个供体和细胞类型中得到验证,证明了人工智能加速生命科学研究的潜力。

Promega 自上而下采用 ChatGPT 加速制造、销售和营销

OpenAI Blog

# Promega 自上而下采用 ChatGPT 加速制造、销售和营销 来源:[https://openai.com/index/promega/](https://openai.com/index/promega/) Promega 的制造业务非常复杂。该公司生产 4,000 种产品,保持生产就绪需要不断提前规划。这种复杂性因客户对定制规格的需求而增加。ChatGPT 帮助 Promega 员工预见这些需求。Promega 总经理 Kristen Yetter 使用 ChatGPT**

GPT-5.5 或许消耗更少的 token,但它始终烧掉更多的钱

Reddit r/artificial

尽管 OpenAI 声称 GPT-5.5 在 token 效率上有所提升,但实际使用成本仍比 GPT-5.4 高出 49% 至 92%;与此同时,Anthropic 的 Claude Opus 4.7 对于较长提示词的实际成本也上涨了 12% 至 27%。这一现象反映出前沿模型价格普遍上涨的趋势,而两家公司均面临巨额预计亏损。

衡量AI加速生物学研究的能力

OpenAI Blog

OpenAI展示了GPT-5通过与Red Queen Bio合作自主优化分子克隆方案的能力,通过新型酶机制实现了克隆效率79倍的提升。该工作展示了AI在湿实验室环境中支持实验迭代和实证验证的潜力,同时强调了生物安全考虑。

Amgen 如何使用 GPT-5

OpenAI Blog

大型制药公司 Amgen 分享了其在运营中如何利用 GPT-5。该案例研究突出了先进 AI 模型在生物技术/制药领域的企业应用。