child-cognition

标签

Cards List
#child-cognition

LEVANTE-bench:使用认知任务对VLM与儿童进行多尺度比较(或者,“你的VLM比五年级学生更聪明吗?”)

arXiv cs.LG · 2026-06-05 缓存

本文介绍了LEVANTE-bench,这是一个系统评估视觉-语言模型在六项认知任务上的表现,并将其与5-12岁儿童的表现进行比较的基准测试,发现当前的VLM仅部分与儿童的认知能力相符。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈