利用人工智能帮助医生诊断影响儿童的罕见遗传疾病

Reddit r/singularity 2026/06/18 15:09 论文

rare-diseases genetic-diagnosis ai-healthcare genomic-analysis openai medical-ai deep-research

摘要

来自Boston Children's Hospital、Harvard和OpenAI的研究人员使用OpenAI o3 Deep Research reasoning模型重新分析了376例未解决的罕见疾病病例，经过专家审查和临床确认后，额外确诊了18例（确诊率4.8%）。这项发表在NEJM AI上的研究展示了人工智能辅助工作流程如何帮助专家在科学知识不断发展的情况下重新审视疑难病例。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/18 15:30

# Using AI to help physicians diagnose rare genetic diseases affecting children Source: https://openai.com/index/diagnose-rare-childhood-diseases/ 即使采用了基因组测序，许多罕见病患者仍然无法获得明确的遗传诊断。在经过了大量检测和专家评估后，大约一半的患者仍未得到确诊。他们的医疗数据中可能包含着线索，但找到这些线索往往需要在成千上万甚至数百万种可能的基因变体、碎片化的临床记录以及快速变化的科学文献中进行筛选。随着新的基因-疾病关系、病例报告和分类证据不断积累，原本无法解决的病例可能会变得可以重新解读。来自波士顿儿童医院Manton罕见病研究中心、哈佛大学和OpenAI的研究人员，使用OpenAI o3 Deep Research推理模型，分析了376例此前已分析但未解决的病例的去识别化临床和基因组信息。该模型为研究人员和临床医生提供了有证据关联的候选解释供其审阅。经过专家审查、补充检测和临床确认，医生在18个病例中建立了诊断——相对于专家此前分析，额外诊断率为4.8%。这项研究于2026年6月18日发表在《NEJM AI》上，展示了AI辅助研究工作流如何帮助专家在重新审视一些最困难的病例时发现线索。这些病例中有许多在多年专家分析后仍未被诊断。在本研究中，OpenAI o3 Deep Research帮助研究人员识别了线索，随后通过既定临床流程进行评估，表明随着知识的发展，专家主导的周期性再分析可以更具可扩展性。该模型并未对任何患者做出诊断，也未做出任何临床决策。它生成了有证据支持的假说，供专家审阅，并在适当情况下通过额外检测和临床实验室确认进行调查。 ## 为什么旧的病例可能包含新的答案不明确的基因检测结果并不总是最终的结论。患者的表型描述、检测结果和家族史可能分散在使用不同标识符、格式和词汇的数据库中。将这些记录关联起来很困难，因此即使是专家也可能漏诊。专家也可能在孩子基因组测序时，尚未有相关基因或其变体与疾病相关联。随着科学知识的进步，相同的数据可能揭示以前无法发现的答案。罕见病的再分析既是一个科学问题，也是一个维护问题。患者的基因组可能保持不变，但围绕它的证据却在不断变化：研究人员将新的基因和变体与疾病联系起来，实验室重新分类旧的变体，病例数据库和论文积累了新的观察结果。每次更新都可能使一个过去未明确的病例值得重新审视，因此许多机构会积压越来越多的基因组，需要与不断变化的知识库保持同步。在这项研究中，研究人员设计的工作流使模型充当了现有基因组流程之上的“解释优先”推理层。模型不是只返回一个排序后的基因，而是被要求将临床特征、遗传模式、变体证据和科学文献连接起来，形成可供人类审阅者质疑的论证。 ## 再分析是如何进行的对于每个病例，团队收集了一个去识别化的资料包，包含用于描述患者临床表现的标准化人类表型本体术语、偶尔的临床医生笔记和任何描述性临床诊断、年龄和性别等元数据，以及一个过滤后的变体表。该表记录了每个变体的稀有性、其对所编码蛋白质的预测影响、ClinVar分类以及所有可用家族成员中的信号质量。大多数病例包括孩子和双亲的数据。团队要求模型提出最合理的分子解释，并展示其推理过程。然后，研究人员使用临床实验室用于分类遗传变体的相同ACMG/AMP框架审阅模型输出。每个候选解释至少由两名团队成员审阅，分歧通过共识解决，模型输出从未被视为诊断。只有在合格专家审阅证据、变体被分类为致病性或可能致病性、CLIA认证实验室确认、并且临床团队将结果反馈给家庭后，该发现才被算作诊断。在分析未解决病例之前，团队对已建立诊断的病例精炼了工作流。在包含各种罕见病的51个病例中，它重复运行了48个病例并恢复了正确的基因和变体。在57个神经肌肉病例中，工作流在45个病例的重复运行中返回了正确的诊断。在一个15个病例的长读长基因组集中，它命名了每个病例的正确基因，并在12个病例中命名了两个致病等位基因。这些评估有助于提示开发，并显示了专家审阅仍然是关键。模型自我报告的置信度分数与这些已解决病例中的正确诊断相关：一致正确调用的平均最低分是85.6，而错误或未知调用是42.1。这些分数不是校准的概率，团队也没有将其用作证据或临床裁决的替代。但它们有助于指导专家审阅者聚焦于最有希望的候选诊断。 ## 研究人员的发现团队随后将该工作流应用于四组此前未解决的病例：患有神经发育疾病的儿童、罕见神经肌肉疾病患者、患有早期精神病的儿童和青少年，以及儿科突发意外死亡病例。这些并非等待首次审查的新病例。许多已经由多个商业或机构流程检查过，并由多学科团队讨论过。 ### 各队列结果早期精神病队列较小，因此其百分比置信区间较宽。诊断率也反映了每个队列具有单基因解释的可能性。在模型提出候选解释、专家完成审查和临床确认后，医生在4.8%的病例中建立了诊断。这个比率虽然不大，但在此群体中具有重要意义，因为之前的专家审查未能解决这些病例。类似的再分析研究报告了在已大量审查的病例中个位数的增益；更高的诊断率通常来自包含新病例或等待遗传确认的已知疾病的研究。在18个诊断中，有7个是再发现：即已在本地研究流程之外建立诊断，但不在团队审查的记录中的情况。在几个病例中，变体已被列为公共数据库中的致病性或可能致病性，突显了跨数据源综合信息的运营挑战。 ## 识别变体时展示的灵活性在一个早期精神病病例中，模型推断出一个未在输入数据中列出的基因组结构事件。它将22号染色体上一系列低质量调用与该儿童的心脏、免疫、神经发育和精神特征联系起来，然后假设了一个与DiGeorge综合征相关的22q11.2缺失。这一假设的变体随后通过后续基因组测序得到确认。尽管提示要求一个单基因原因，但模型有时会提出两个基因以更好地解释复杂的临床表现。在一个病例中，*LAMA2*和*FOXP1*的变体共同解释了肌肉和神经发育特征；另一个病例则存在一种此前未被识别的涉及*TTN*和*SRPK3*的双基因解释。 ## 产生可检验的、生物学上一致的假说除了诊断之外，模型还识别出一种名为白癜风的疾病可能的新机制解释。在一个神经发育病例中，模型在一名白癜风患者中强调了*S1PR1*中的一个11氨基酸缺失。*S1PR1*编码一种参与信号传导、免疫细胞移动和组织生物学的细胞表面受体。模型整合的证据表明，该缺失可能改变受体结构和信号传导，从而减少色素产生，同时帮助免疫细胞在皮肤中持续存在。所提出的*S1PR1*-白癜风关系需要额外的实验验证，但它展示了AI在将结构生物学、免疫学和临床遗传学中零散的发现转化为具体、可检验的假说方面的强大作用。团队还在神经肌肉队列中观察到可能的表型扩展。*HSPB8*和*CDK13*中的破坏性变体并不完全匹配这些基因最知名的疾病，表明存在更广泛的临床谱系，需要更多病例和实验室工作来检验。 ## 局限性这项研究表明，一个通用推理模型可以通过将表型、遗传模式、变体注释、数据质量模式和科学文献结合成可供审查的假说，为回顾性基因组再分析做出贡献。它同时也显示了为什么定期再分析很重要：只有在知识进步或碎片化记录被整合后，某些答案才会浮现。这项研究并不证明患者、临床医生或客户应该使用OpenAI模型来诊断疾病或做出医疗决策。它不描述或支持将OpenAI o3 Deep Research、ChatGPT或任何其他OpenAI产品用于诊断的预期客户使用。该模型没有诊断任何参与者；所有诊断均由医生和其他合格临床专家通过既定审查、检测和临床确认流程做出。该研究是回顾性的，队列是异质性的，审查者并未对模型置信度设盲。研究人员未测量节省的时间、成本、临床医生工作量、假阳性工作量或护理变化。他们也未系统评估其他形式的遗传变异，如结构变异、重复扩展、深内含子变化或嵌合现象。大型语言模型可能会误读上下文或产生看似合理但经不起推敲的解释。因此，每个结果都经过了人类裁决和临床确认。该模型拓宽了搜索范围并聚焦了随后的以人类为主导的分析；它并未决定应向家庭返回哪些信息或诊断。本研究使用了去识别化信息，未在批准环境之外使用或传输受保护的健康信息。更广泛的临床部署需要像所有医疗护理一样关注隐私、安全、可审计性和当地法规。模型访问并不能替代测序基础设施、遗传咨询、确认性检测或专家判断。 Dr. Catherine Brownstein, Boston Children’s Hospital’s Manton Center for Orphan Disease Research Alan Beggs, director of the Manton Center for Orphan Disease Research ## 未来展望未来的前瞻性多中心研究应将LLM辅助再分析与常规实践在诊断率、找到候选解释的时间、临床医生工作量、假阳性负担、成本和对护理的影响方面进行比较。版本化的提示、参考文献核查、审计日志和校准的不确定性对于可重复性和安全性至关重要。这样的研究仍然需要合格的临床医生来评估证据、安排适当的检测并做出任何诊断或治疗决策。本研究使用了OpenAI o3 Deep Research。新型通用模型可以搜索和综合更多科学材料，而像GPT‑Rosalind这样的专用系统则为更深入的生命科学工作设计，包括变体对蛋白质结构和功能的影响。这些能力未在本研究中测试，需要其自身的评估和访问控制。虽然OpenAI帮助支持了这项初步研究，但Manton中心将通过OpenAI基金会的资助领导下一阶段的工作。该资助将支持该中心更广泛的努力，开发一个平台无关、低成本的遗传学AI副驾驶，帮助临床团队更快、更一致地分析罕见病病例。更长期的研究机会是探索专家主导的AI辅助再分析是否能够帮助科学理解跟上发现的步伐。其前景并非AI取代医生的诊断，而是经过仔细评估的研究工具可能帮助专家识别值得调查的证据。对于成千上万的家庭来说，今天尚未解答的问题不必永远得不到答案。

利用人工智能帮助医生诊断影响儿童的罕见遗传疾病

相似文章

@OpenAI: 罕见病诊断充满挑战，因为测序可能揭示数百万种变异，而医学知识不断变化……

波士顿儿童医院利用AI解锁新诊断

一种专门用于加速罕见病诊断的推理型大型语言模型：一项随机AI医生辅助试验

@OpenAI：许多病例多年来一直未被专家分析所破解。这项研究表明，人工智能可以让专家主导的定期再分析更具可扩展性，帮助临床医生随着医学知识的进步重新审视病例，并可能为更多此前难以分析的病例找到答案。

用 OpenAI o1 解码遗传学

提交意见反馈