earth-system

标签

Cards List
#earth-system

TerraBench:智能体能否推理异构地球系统数据?

arXiv cs.AI · 5天前 缓存

TerraBench 是一个新基准,用于评估人工智能智能体在异构地球系统数据(包括网格数据、卫星图像和模拟器输出)上进行推理的能力。它揭示了当前前沿模型的显著局限性,表现最佳的模型平均工具使用得分仅为 59.2%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈