belief-modeling

标签

Cards List
#belief-modeling

OmniToM: 通过显式信念建模对大语言模型的心智理论进行基准测试

arXiv cs.AI · 2026-05-27 缓存

OmniToM 引入了一个基准测试,通过要求显式提取和标注信念结构来评估大语言模型的心智理论,揭示了尽管模型在端点问答任务上表现强劲,但在跟踪角色特定信念方面存在瓶颈。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈