标签
本文介绍了 CAPRI,一个用于评估 LLMs 是否能够从对话线索中推断用户文化背景并相应调整回应(例如使用适当的计量单位)的数据集。实验表明,LLMs 能够推断文化背景,但除非明确提示,否则常常未能应用这一信息。