code-act

标签

Cards List
#code-act

面向快速医疗互操作性资源(FHIR)中工具调用代理的强化学习

arXiv cs.LG · 2026-05-15 缓存

本文介绍了一种针对在FHIR医疗数据上运行的工具调用LLM代理的强化学习后训练流水线,在使用较小的Qwen3-8B模型时,在FHIR-AgentBench上达到了77%的答案正确率,而o4-mini仅为50%。

0 人收藏 0 人点赞
#code-act

ReAct 还是 CodeAct,这是问题所在

Reddit r/AI_Agents · 2026-05-10

本文探讨了 AI 工程中 ReAct 和 CodeAct 两种编排范式的利弊,强调了 CodeAct 在处理复杂任务时的高效性,并介绍了一个新的开源框架。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈