quiz-games

标签

Cards List
#quiz-games

LLM团队能玩‘What? Where? When?’吗?

arXiv cs.CL · 2026-06-01 缓存

本文研究了在问答游戏‘What? Where? When?’(ChGK)中,基于团队协作的交互是否能提升LLM的表现。通过在2025年发布的572道问题的数据集上使用六个最新的开源LLM,他们展示了团队策略(投票、沉默队长、健谈队长)比单个模型高出最多20个百分点,最佳团队达到了44.23%的准确率,接近人类水平。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈