OncoAgent:用于保护隐私的肿瘤临床决策支持的双层多智能体框架
摘要
本文介绍了 OncoAgent,这是一种专为肿瘤学隐私保护临床决策支持设计的双层多智能体框架。文章详细阐述了结合修正型 RAG、反思安全循环以及针对 AMD 硬件优化的双层 QLoRA 微调的系统架构。
暂无内容
查看缓存全文
缓存时间: 2026/05/09 18:31
“OncoAgent:用于保护隐私的肿瘤学临床决策支持的双层级多智能体框架” 来源:https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper 返回文章列表 (https://huggingface.co/blog) Máximo López Chenlo 的头像 (https://huggingface.co/MaximoLopezChenlo) - 摘要 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#abstract) - 1. 引言 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#1-introduction) - 2. 相关工作 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#2-related-work)- 2.1 临床 LLM 与决策支持 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#21-clinical-llms-and-decision-support) - 2.2 多智能体架构 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#22-multi-agent-architectures) - 2.3 医学中的检索增强生成 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#23-retrieval-augmented-generation-in-medicine) - 3. 系统架构 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#3-system-architecture)- 3.1 概述 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#31-overview) - 3.2 复杂度路由与模型分层 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#32-complexity-router-and-model-tiering) - 3.3 带文档分级的纠正性 RAG (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#33-corrective-rag-with-document-grading) - 3.4 反思安全循环(批评节点) (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#34-reflexion-safety-loop-critic-node) - 3.5 人在回路网关与回退机制 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#35-human-in-the-loop-gate-and-fallback) - 3.6 按患者隔离的内存 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#36-per-patient-memory-isolation) - 4. 知识库构建与 RAG 流水线 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#4-knowledge-base-construction-and-rag-pipeline)- 4.1 指南摄取与清洗 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#41-guideline-ingestion-and-sanitisation) - 4.2 医学嵌入与向量存储 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#42-medical-embeddings-and-vector-store) - 4.3 四阶段检索流水线 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#43-four-stage-retrieval-pipeline) - 5. 双层级 QLoRA 微调 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#5-dual-tier-qlora-fine-tuning)- 5.1 训练语料库:OncoCoT(266,854 个样本) (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#51-training-corpus-oncocot-266854-samples) - 5.2 QLoRA 配置 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#52-qlora-configuration) - 5.3 使用 Unsloth 优化 AMD MI300X (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#53-amd-mi300x-optimisation-with-unsloth) - 5.4 序列打包与吞吐量突破 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#54-sequence-packing-and-throughput-breakthrough) - 6. 安全与隐私框架 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#6-safety-and-privacy-framework)- 6.1 零 PHI 政策 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#61-zero-phi-policy) - 6.2 分层安全架构 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#62-layered-safety-architecture) - 7. 临床界面 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#7-clinical-interface) - 8. 结果 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#8-results) - 9. 讨论 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#9-discussion)- 9.1 硬件主权作为临床需求 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#91-hardware-sovereignty-as-a-clinical-requirement) - 9.2 吞吐量突破 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#92-the-throughput-breakthrough) - 9.3 局限性 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#93-limitations) - 10. 结论 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#10-conclusion) - 参考文献 (https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#references) 缩略图:https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/blog/oncoagent-thumbnail.png作者: - 用户:oncoagent-research 标签: - 肿瘤学 - 多智能体 - LangGraph - RAG - QLoRA - AMD - 开源 - 临床 AI - 医疗保健 ## https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#oncoagent-a-dual-tier-multi-agent-framework-for-privacy-preserving-oncology-clinical-decision-support-1OncoAgent:用于保护隐私的肿瘤学临床决策支持的双层级多智能体框架 技术预印本 · 2026 年 5 月 · OncoAgent 研究组 — ## https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#abstract摘要 我们提出了 OncoAgent,这是一个开源的、保护隐私的肿瘤学临床决策支持系统。OncoAgent 结合了双层级微调 LLM 架构与最先进的多智能体 LangGraph 拓扑结构,针对 70 余份医师级 NCCN 和 ESMO 指南实施了四阶段纠正性 RAG 流水线,并采用三层反思安全验证器严格执行零 PHI(个人健康信息)政策。该系统通过加法复杂度评分器将临床查询路由至 9B 参数的速度优化模型(第一层)或 27B 深度推理模型(第二层),这两个模型均在 AMD Instinct MI300X 硬件(192 GB HBM3)上使用 Unsloth 框架,基于 266,854 个真实和合成生成的肿瘤病例语料库通过 QLoRA 进行微调。MI300X 上的序列打包使得全数据集微调在约 50 分钟 内完成——相比基于 API 的生成实现了 56 倍的吞吐量加速。后处理中,CRAG 文档分级实现了 100% 的成功率,平均 RAG 置信度得分达到 2.3+。整个系统 100% 开源且可本地部署,消除了对专有云 API 的依赖,并保留了患者数据主权。 **关键词:**临床决策支持,肿瘤学 AI,多智能体系统,检索增强生成,QLoRA,AMD ROCm,开源医疗 AI,人在回路安全,LangGraph,纠正性 RAG — ## https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#1-introduction1. 引言 肿瘤学是临床医学中信息密度最高、认知要求最严格的领域之一。循证指南的体量、异质性及其快速演变——从美国国家综合癌症网络(NCCN)到欧洲肿瘤内科学会(ESMO)——在已发表的证据与床边实践之间造成了持续的知识差距。AI 辅助的临床决策支持系统在弥合这一差距方面具有变革潜力,然而大多数商用系统在三个关键方面存在失败: 1. 幻觉推荐未基于经验证的指南 2. 云 API 依赖阻碍了在注重隐私的医院环境中进行本地部署 3. 单体 LLM 架构在复杂的多共病表现下容易上下文饱和 OncoAgent 围绕三个核心原则设计: - **架构分解:**临床推理被分解为八个专门的 LangGraph 节点,每个节点具有有界的、可审计的功能。 - **接地生成:**所有模型输出均通过带有显式相关性门控的四阶段检索流水线锚定到策展的向量知识库中。 - **硬件主权:**完整的推理和训练堆栈在 AMD Instinct MI300X 上原生运行,使用 ROCm 和开源框架——从而实现无需数据外流的医院部署。 — ## https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#2-related-work2. 相关工作 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#21-clinical-llms-and-decision-support2.1 临床 LLM 与决策支持 大型语言模型在临床自然语言处理任务(包括诊断编码、文献摘要和患者沟通)中展现了显著潜力。领域特定的微调方法——以 BioMedLM、Med-PaLM 2 和 ClinicalBERT 为例——在医疗基准测试中一致地提升了通用模型的性能。OncoAgent 扩展了这一系列工作,专门针对肿瘤分诊和治疗路径推荐这一特定子领域,在该领域中幻觉的后果最为严重。 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#22-multi-agent-architectures2.2 多智能体架构 分解式多智能体系统已成为处理复杂推理任务的一种原则性方法。OncoAgent 综合了四种经典的 SOTA 模式: - Claude Code 模式——将确定性安全 harness 与 LLM 推理分离 - Hermes Agent 模式——带有每会话内存隔离的结构化工具调用 - 纠正性 RAG(Shi 等,2024)——文档相关性分级和查询重写 - 反思(Shinn 等,2023)——通过反馈增强重试循环实现自我纠正生成 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#23-retrieval-augmented-generation-in-medicine2.3 医学中的检索增强生成 标准的双编码器检索不适合术语精确度至关重要的临床领域(例如,“酪氨酸激酶抑制剂” vs “TKI”)。OncoAgent 实现了具有交叉编码器重排的多阶段流水线,并集成了假设文档嵌入(HyDE;Gao 等,2022),通过将自然语言查询投影到指南嵌入空间中来解决医学术语不匹配问题。 — ## https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#3-system-architecture3. 系统架构 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#31-overview3.1 概述 OncoAgent 使用 LangGraph 实现为有向状态图。系统状态表示为不可变的 AgentState TypedDict,包含 11 个逻辑部分和大约 30 个类型化键。每个节点追加到特定键而不变动上游数据,保留完整的审计轨迹。8 节点拓扑为: 路由器 → 摄取 → 纠正性 RAG → 专家 ↔ 批评家 → 人在回路网关 → 格式化器 → 结束 ↓ 回退 → 结束 关键属性: - 5 个条件边 - 1 个反思重试循环(最大 2 次迭代) - 1 个针对高复杂度或低置信度输出的强制人在回路中断 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#32-complexity-router-and-model-tiering3.2 复杂度路由与模型分层 在调用专家之前,使用加权加法模型量化病例复杂度: S = w_cancer + w_stage + w_mutations + w_treatment 其中: 因素 条件 权重 癌症类型 罕见 +0.40 癌症类型 原发灶不明 +0.30 分期 IV 期 +0.25 分期 III 期 +0.15 突变 ≥2 个已识别 +0.30 突变 单个 +0.15 既往治疗 任何关键词匹配 +0.10 决策边界: S ≥ 0.5 → 第二层(Qwen 3.6-27B 深度推理)· S < 0.5 → 第一层(Qwen 3.5-9B 速度分诊) 验证: 一例带有 KRAS + BRCA2 突变的 IV 期胰腺癌病例正确产生 S = 0.80,路由至第二层。✅ 临床医生也可以通过 UI 手动覆盖层级选择。 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#33-corrective-rag-with-document-grading3.3 带文档分级的纠正性 RAG CRAG 节点在将文档转发给专家之前,对每个检索到的文档进行临床相关性分级。未通过二元相关性分类的文档会触发自动查询重写(最大 1 次重试)。这消除了 RAG 流水线中主要的幻觉来源——检索到标题看似合理但语义无关的内容。在将分级步骤从 Qwen 3.5 迁移到 Qwen 2.5 Instruct 后,成功率从 0% 提升至 100%,在子宫内膜癌分诊测试中 RAG 置信度得分达到 2.3+。 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#34-reflexion-safety-loop-critic-node3.4 反思安全循环(批评节点) 批评节点在任何输出到达人在回路网关之前运行三层验证级联: 1. 格式检查——验证是否符合 OncoCoT 输出模式的结构合规性 2. 安全检查——基于确定性规则扫描禁止的输出模式(如无指南引用的绝对剂量、药物相互作用遗漏等) 3. LLM 蕴涵检查——验证专家的建议是否完全由检索到的 RAG 上下文支持 若失败,批评节点的具体反馈将注入回专家上下文中进行重试(最大 2 次迭代)。至关重要的是,批评节点作为 确定性代码 运行,而非 LLM 控制的逻辑——确保安全执行不能被对抗性提示绕过。 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#35-human-in-the-loop-gate-and-fallback3.5 人在回路网关与回退机制 人在回路网关为所有第二层病例以及任何 rag_confidence < 0.3 的输出提供强制临床医生中断。专用的回退节点捕获不可恢复的故障并返回临床安全的拒绝——“提供的指南中信息不具结论性”——避免在任何故障模式下出现幻觉替代方案。 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#36-per-patient-memory-isolation3.6 按患者隔离的内存 PatientMemoryStore 模块为每个患者会话分配唯一的 thread_id(格式 PT-XXXX),作为 configurable 参数传递给 LangGraph 的原生检查点系统。这强制执行严格的每患者内存隔离,同时允许在会话内进行迭代的多轮咨询。 — ## https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#4-knowledge-base-construction-and-rag-pipeline4. 知识库构建与 RAG 流水线 ### https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper#41-guideline-ingestion-and-sanitisation4.1 指南摄取与清洗 知识库由 77 份直接医师指南 PDF 构建而成,由并发网页爬虫识别,该爬虫在 60 秒内处理了 138 个 NCCN 详细页面。文本提取使用 PyMuPDF(fitz)进行块级
相似文章
SafeRx-Agent:一个基于知识的多智能体框架,用于安全且可解释的药物推荐
介绍了SafeRx-Agent,一种基于知识的多智能体框架,用于安全且可解释的药物推荐,可生成细粒度的ATC代码预测,同时控制药物相互作用和禁忌症,在MIMIC-III和MIMIC-IV数据集上进行了评估。
迈向Vibe医学:一种用于临床决策支持的自进化多智能体框架
本文提出了VIBEMed,一种具有自进化机制和安全沙箱的多智能体框架,用于稳健的临床决策支持,集成了专门用于诊断、治疗计划以及随时间演化临床知识的智能体。
基于Agentic AI的框架:缓解医疗应用中的过早诊断交接与无声幻觉
本文提出了一种多智能体框架,采用确定性编排和神经符号状态跟踪,以减轻医疗LLM应用中的过早诊断交接和无声幻觉。
MedExAgent:在嘈杂的临床环境中训练大语言模型代理进行询问、检查与诊断
本文介绍了 MedExAgent,这是一个将临床诊断形式化为部分可观测马尔可夫决策过程(POMDP)以处理嘈杂和不完整信息的框架。该框架提出了一种结合监督微调与强化学习的两阶段训练流程,以提高医疗大语言模型的诊断准确性和成本效益。
PrivFusion:一种用于协调分布式数据集的隐私保护多智能体框架
PrivFusion 是一个隐私保护的多智能体框架,可在联邦训练之前自动协调跨机构的结构化数据集,从而减少人工工作量,并实现对敏感临床数据的协作分析。