controlled-evaluation

标签

Cards List
#controlled-evaluation

HalluWorld:基于参考世界模型的可控幻觉基准

arXiv cs.CL · 2026-05-20 缓存

HalluWorld 是一个可控基准框架,通过显式的参考世界模型在网格世界、国际象棋和实际终端任务等合成环境中评估大型语言模型中的幻觉。它可以细粒度分析各种故障模式,例如感知幻觉、多步状态追踪和因果模拟,揭示出前沿模型在处理扩展思维无法解决的复杂推理时仍然存在困难。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈