BitTide
首页
最新
模型
工具
新闻
产品
论文
事件
今日日报
搜索
订阅
English
登录
belief-modeling
标签
Cards
List
#belief-modeling
OmniToM: 通过显式信念建模对大语言模型的心智理论进行基准测试
arXiv cs.AI
↗
· 2026-05-27
缓存
OmniToM 引入了一个基准测试,通过要求显式提取和标注信念结构来评估大语言模型的心智理论,揭示了尽管模型在端点问答任务上表现强劲,但在跟踪角色特定信念方面存在瓶颈。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交