训练大型语言模型以预测临床事件

Hugging Face Daily Papers 2026/05/12 00:00 论文

clinical-prediction foresight-learning lora llm-fine-tuning healthcare mimic-iii

摘要

Foresight Learning 将纵向临床记录转换为预测示例，与基础模型相比，LoRA 适配器改善了校准并减少了不确定性，在保留问题上优于 GPT-5。

纵向临床记录包含了患者随时间演变的丰富证据，但如何将这些信号转化为临床预测的训练监督仍然具有挑战性。我们将 Foresight Learning 扩展到临床预测领域，通过将按时间排序的 MIMIC-III 记录转换为包含患者过往背景、关于可能未来事件的自然语言问题以及从后续文档中解析出的标签的示例。这一过程从 702 次入院记录中生成了 6,900 个预测示例，涵盖药物、手术、器官支持、微生物学和死亡率。在这些示例上训练的小型 LoRA 适配器比提示下的基础模型表现更好，将预期校准误差从 0.1269 降低到 0.0398，Brier 分数从 0.199 降低到 0.145，同时在保留问题上略优于 GPT-5 的点估计。该方法使得从纵向记录中实现可重用的临床预测监督成为可能，无需手动设计的结构化特征或特定终点的分类器。

查看原文

查看缓存全文

缓存时间: 2026/05/22 06:34

Paper page - Training Large Language Models to Predict Clinical Events

来源：https://huggingface.co/papers/2605.12817 发布于 5月12日

由 https://huggingface.co/Bturtel 提交

Ben (https://huggingface.co/Bturtel) 于 5月22日

摘要

纵向临床笔记通过前瞻学习被转换为时间预测示例，从而通过LoRA适配改进临床预测，相比基础模型，校准能力提升且不确定性降低。

纵向临床笔记记录了患者随时间演变的丰富证据，但将这些信号转化为临床预测的训练监督仍具挑战性。我们将前瞻学习扩展至临床预测，通过将时间排序的MIMIC-III笔记转换为包含患者过去背景、关于未来可能事件的自然语言问题以及后续文档解析标签的示例。该过程从702次入院中获得了6,900个预测示例，涵盖药物、手术、器官支持、微生物学和死亡率。基于这些示例训练的小型LoRA适配器优于提示基础模型，将预期校准误差从0.1269降至0.0398，Brier分数从0.199降至0.145，同时在保留问题上的点估计略优于GPT-5。该方法无需手工设计的结构化特征或特定终点分类器，即可从纵向笔记中实现可复用的临床预测监督。

查看 arXiv 页面 (https://arxiv.org/abs/2605.12817)查看 PDF (https://arxiv.org/pdf/2605.12817)项目页面 (https://arxiv.org/abs/2605.12817)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.12817)

在您的智能体中获取此论文：

hf papers read 2605.12817

没有最新的 CLI？curl -LsSf https://hf.co/cli/install.sh | bash

引用该论文的模型0

没有模型关联此论文

在模型 README.md 中引用 arxiv.org/abs/2605.12817 即可从本页关联。

引用该论文的数据集0

没有数据集关联此论文

在数据集 README.md 中引用 arxiv.org/abs/2605.12817 即可从本页关联。

引用该论文的 Space0

没有 Space 关联此论文

在 Space README.md 中引用 arxiv.org/abs/2605.12817 即可从本页关联。

包含该论文的收藏0

没有收藏包含此论文

添加此论文至收藏 (https://huggingface.co/new-collection) 即可从本页关联。

训练大型语言模型以预测临床事件

Paper page - Training Large Language Models to Predict Clinical Events

摘要

引用该论文的模型0

引用该论文的数据集0

引用该论文的 Space0

包含该论文的收藏0

相似文章

LoRA Speedrun – a public wall-clock leaderboard for fine-tuning techniques

LLM4EHR：通过大型语言模型对齐临床时间序列与医疗事件序列

谁在COVID-19后陷入财务脆弱？基于MEPS数据的人群层面机器学习分析

大型语言模型作为统一多模态学习器用于临床预测

Cura 1T：面向智能体医疗的专用模型

提交意见反馈