clinical-decision-making

标签

Cards List
#clinical-decision-making

ClinicalMC:面向大语言模型的多疗程临床决策基准

arXiv cs.AI · 18小时前 缓存

ClinicalMC是一个基准,旨在评估大语言模型在多疗程临床决策中的表现,包含中文和英文数据集以及一个多智能体评估框架。

0 人收藏 0 人点赞
#clinical-decision-making

AI评分员在复杂临床决策中的区分能力取决于评分协议

arXiv cs.CL · 18小时前 缓存

本研究考察了AI评分员(LLMs)在复杂2型糖尿病药物治疗中根据不同协议对临床AI输出进行评分的方式,发现基于评分标准的评分比无标准评分具有更强的区分能力。

0 人收藏 0 人点赞
#clinical-decision-making

EHRBench:用于大语言模型临床决策的自动化可靠电子健康记录基准

arXiv cs.AI · 2天前 缓存

EHRBench是一个自动化且可靠的基准测试,利用真实电子健康记录评估大语言模型在临床决策任务上的表现,涵盖诊断、治疗和预后任务,包含近100万个问答条目。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈