knowledge-base-verification

标签

Cards List
#knowledge-base-verification

EHRBench:用于大语言模型临床决策的自动化可靠电子健康记录基准

arXiv cs.AI · 2天前 缓存

EHRBench是一个自动化且可靠的基准测试,利用真实电子健康记录评估大语言模型在临床决策任务上的表现,涵盖诊断、治疗和预后任务,包含近100万个问答条目。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈