long-term-history

标签

Cards List
#long-term-history

长期历史感知的医疗对话合成与评估

arXiv cs.CL · 2026-05-20 缓存

本文介绍了一种利用大语言模型(LLMs)合成长期医疗对话数据集的框架,并创建了 MediLongChat,包含三个基准任务,用于评估医疗智能体的记忆与推理能力。实验表明,即使是最先进的 LLMs 也难以完成这些任务。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈