cooperative-task

标签

Cards List
#cooperative-task

GPTNT:在《Keep Talking and Nobody Explodes》中对多模态代理间实时协作的基准测试

arXiv cs.AI · 昨天 缓存

本文介绍了GPTNT,这是一个基于《Keep Talking and Nobody Explodes》构建的基准测试,要求两个多模态代理在时间压力和信息不对称条件下实时协作,揭示了当前最先进系统的关键弱点。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈