标签
本文提出ActionRating,一种将澄清置于代理的动作空间内,与导航共享一个顺序标尺的公式,实现了两种信息寻求模式(强制性和机会性)。在分层分类法基准测试中,使用9个LLM的实验表明,机会性澄清提高了准确性和信息寻求效率。