long-term-history

#long-term-history

长期历史感知的医疗对话合成与评估

arXiv cs.CL ↗ · 2026-05-20 缓存

本文介绍了一种利用大语言模型（LLMs）合成长期医疗对话数据集的框架，并创建了 MediLongChat，包含三个基准任务，用于评估医疗智能体的记忆与推理能力。实验表明，即使是最先进的 LLMs 也难以完成这些任务。

0 人收藏 0 人点赞