belief-modeling

#belief-modeling

OmniToM: 通过显式信念建模对大语言模型的心智理论进行基准测试

arXiv cs.AI ↗ · 2026-05-27 缓存

OmniToM 引入了一个基准测试，通过要求显式提取和标注信念结构来评估大语言模型的心智理论，揭示了尽管模型在端点问答任务上表现强劲，但在跟踪角色特定信念方面存在瓶颈。

0 人收藏 0 人点赞