标签
本文提出ActionRating,一种将澄清置于代理的动作空间内,与导航共享一个顺序标尺的公式,实现了两种信息寻求模式(强制性和机会性)。在分层分类法基准测试中,使用9个LLM的实验表明,机会性澄清提高了准确性和信息寻求效率。
作者认为多智能体循环故障是由糟糕的组织设计而非提示词工程导致的,提出一种具有明确权限和终止条件的分层结构以防止无限循环。