protocol-execution

标签

Cards List
#protocol-execution

面向临床智能体的世界反馈:在FHIR环境中诊断强化学习

arXiv cs.AI · 13小时前 缓存

本文研究了在FHIR环境中为临床协议执行任务使用来自世界反馈的强化学习,识别了诸如高静默完成上限和零梯度任务等结构性障碍,并引入了具有更低上限的MedAgentBench-v3。它表明,由于这些障碍,纯强化学习表现不如基于规则的SFT,并提出了一种结合SFT+RL的方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈