capability-profile

标签

Cards List
#capability-profile

GENSTRAT:迈向大型语言模型战略推理科学

arXiv cs.AI · 2026-05-25 缓存

本文介绍了GENSTRAT,一个利用程序生成的战略环境来评估LLMs在多维度上的战略推理能力的基准,解决了固定游戏套件的局限性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈