标签
本文介绍了从生物医学文献中提取治疗药物-疾病关系适用条件的任务,创建了一个手动标注的三元组数据集,并提出了一种增强LoRA的方法,该方法优于现有基线方法。
AAbAAC是一个手动标注的语料库,包含115篇PubMed摘要,用于自身免疫信息提取,重点关注自身免疫疾病和自身抗体等实体。研究表明,在该语料库上进行微调后,命名实体识别(NER)性能有所提升。
介绍BioDivergence,一个用于检测生物医学摘要中上下文条件矛盾的基准与评估框架,包含六类冲突分类法和一个由11,865个声明对构成的银标准数据集。
这项大规模研究涵盖 5 个模型(7B–72B)、10 个生物医学问答数据集、4 种检索方法和 4 个语料库,发现在生物医学问答任务中,RAG 相比无检索基线仅带来微小且不稳定的提升(1–2 个百分点)。研究得出结论:主要瓶颈并非检索质量,而是模型有效利用检索证据的能力有限。
本文提出了一种针对生物医学出版物类型和研究设计分类的鲁棒评估框架及训练策略,利用知识引导的扰动来降低模型对虚假特征的依赖。
# 将结构化生物医学知识注入语言模型:持续预训练与GraphRAG 来源:[https://arxiv.org/html/2604.16422](https://arxiv.org/html/2604.16422) ###### 摘要 将领域特定知识注入模型对于使语言模型(LMs)适应生物医学等专业领域至关重要。尽管目前大多数方法依赖于非结构化文本语料库,但本研究探讨了两种利用UMLS元术语表(Metathesaurus)中结构化知识的互补策略:
DeepER-Med引入了一个用于循证医学研究的智能体AI框架,具有明确的证据评价标准和新的基准数据集(DeepER-MedQA),包含100个专家精选的医学问题,相比生产平台表现更优,并通过真实案例的临床验证。
# 论文页面 - MedConclusion:基于结构化摘要的生物医学结论生成基准 来源:[https://huggingface.co/papers/2604.06505](https://huggingface.co/papers/2604.06505) ## 摘要 一个用于生物医学结论生成的大规模数据集,包含570万条PubMed结构化摘要,旨在评估大型语言模型基于结构化科学证据进行推理的能力。[大型语言模型](https://huggingface.co/papers?q=Large%20langu