标签
本文提出了一个模型自适应的工具必要性定义,并发现 LLM 内部识别需要工具与实际调用工具之间存在 26% 到 54% 的不匹配,集中体现在认知到行动的转换阶段。它揭示了一个“知行差距”(knowing-doing gap),即模型通常知道应该调用工具,但由于后期层几何结构将信号旋转至几乎与行动正交,导致调用失败。
本文提出了一种模型自适应的工具必要性定义,揭示了模型应该使用工具与实际使用工具之间的显著不匹配。作者将工具使用分解为认知和行动两个阶段,发现大多数错误发生在将识别转化为行动的过程中,识别出LLM工具使用中的'知行差距'。