quiz-games

#quiz-games

LLM团队能玩‘What? Where? When?’吗？

arXiv cs.CL ↗ · 2026-06-01 缓存

本文研究了在问答游戏‘What? Where? When?’（ChGK）中，基于团队协作的交互是否能提升LLM的表现。通过在2025年发布的572道问题的数据集上使用六个最新的开源LLM，他们展示了团队策略（投票、沉默队长、健谈队长）比单个模型高出最多20个百分点，最佳团队达到了44.23%的准确率，接近人类水平。

0 人收藏 0 人点赞

quiz-games

LLM团队能玩‘What? Where? When?’吗？

提交意见反馈