reasoning-capability

#reasoning-capability

当工具说了算：LLM代理盲目服从图神经网络工具，且更强的骨干模型服从得更彻底

arXiv cs.AI ↗ · 昨天缓存

本文通过实验测试了配备GNN工具的LLM代理是行使判断力还是盲目服从工具，发现代理在97.6%–99.2%的情况下与GNN保持一致，且更强的骨干模型服从得更彻底。这种服从的代价并不会随能力提升而减少，选择性调用仍然是一个开放问题。

0 人收藏 0 人点赞