面向南非结核病诊疗的领域专用大语言模型开发与初步评估

arXiv cs.CL 2026/04/23 04:00 论文

tuberculosis domain-specific-llm biomedical-ai south-africa qlora graphrag

摘要

研究人员使用QLoRA与GraphRAG对BioMistral-7B进行微调，构建面向南非结核病诊疗的LLM，在上下文对齐方面优于基座模型。

arXiv:2604.19776v1 公告类型：new 摘要：结核病（TB）是全球最致命的传染病之一，在南非给医疗体系带来沉重负担。本文报告了一项实验研究，开发面向结核病诊疗的领域专用大语言模型（DS-LLM），以减轻患者与医护人员的压力。首先，通过文献综述梳理当前医学领域LLM开发策略；随后，收集南非TB指南、精选TB文献及现有医学基准数据集。我们采用量化低秩适配（QLoRA）算法对医学LLM BioMistral-7B进行微调，并引入GraphRAG实现检索增强生成。最终DS-LLM与原始BioMistral-7B及通用LLM对比，通过自动化指标与定量评分评估。结果显示，DS-LLM在南非结核病诊疗的上下文对齐（词汇、语义、知识）方面表现更佳。

查看原文导出为 Word 导出为 PDF

查看缓存全文

缓存时间: 2026/04/23 10:02

# 南非结核病诊疗领域专用大语言模型的开发与初步评估
来源：https://arxiv.org/abs/2604.19776  
查看 PDF（https://arxiv.org/pdf/2604.19776）

> 摘要：结核病（TB）是全球最致命的传染病之一，在南非，它给该国医疗体系带来沉重负担。本文报告了一项实验研究，旨在开发一款面向结核病诊疗的领域专用大语言模型（DS-LLM），以减轻患者与医护人员的压力。研究首先通过文献综述梳理当前医学领域 LLM 的开发策略；随后收集南非 TB 指南、精选 TB 文献及现有医学基准数据集。我们采用量化低秩适配（QLoRA）算法对医学 LLM BioMistral-7B 进行微调，并引入基于图的检索增强生成（GraphRAG）。通过自动化指标与人工量化评分，将所构建的 DS-LLM 与基础 BioMistral-7B 及通用 LLM 进行对比。结果显示，DS-LLM 在南非结核病场景下的语境对齐（词汇、语义与知识）表现优于基础模型。

## 投稿历史

来自：Olawande Daramola 教授 [查看邮件](https://arxiv.org/show-email/a3ae5965/2604.19776) **\[v1\]** 2026 年 3 月 28 日（周六）11:22:05 UTC（651 KB）

面向南非结核病诊疗的领域专用大语言模型开发与初步评估

相似文章

@cjzafir: 垂直语言模型（VLMs）正在击败顶级大语言模型。这些参数量7B到15B的小型专精模型在各自的细分领域击败了SoTA模型……

语言模型能否识别乳腺癌放疗的副作用？

LLiMba：单卡GPU上的撒丁语——将3B参数语言模型适配至一种濒临消失的罗曼语族语言

MedAction：迈向主动式多轮临床诊断大语言模型

将结构化生物医学知识注入语言模型：持续预训练与GraphRAG对比

提交意见反馈