benchmark-evaluation

标签

Cards List
#benchmark-evaluation

智能体会探索却无视:大语言模型缺乏环境好奇心

Hugging Face Daily Papers · 2026-04-19 缓存

学术研究指出,大语言模型智能体常在环境中发现完整解法却几乎从不利用,暴露出对开放性任务至关重要的“环境好奇心”缺失。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈