cooperative-games

标签

Cards List
#cooperative-games

CollabBench:通过主动参与与多样玩家基准测试并释放LLM协作能力

arXiv cs.CL · 3天前 缓存

CollabBench是一个新的基准测试,用于评估和训练LLM智能体在合作游戏中的表现,具有多样玩家模拟和协作训练范式。实验表明,与基础模型相比,效率提高19.5%,情感性能提升24.4%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈