标签
本文通过分析早期解码动态,研究了激活引导在LLM上何时成功或失败。作者引入了ASTEER,这是一个包含大量引导生成结果的大型测试平台,并训练了一个GBDT分类器,通过早期隐藏状态预测引导结果,从而实现高效的引导强度搜索。
本文研究了秩1激活引导在何时有效且具成本效益,提出了几何引导搜索和粒度的概念来解释变异性,并引入了GRACE框架用于高效的大语言模型控制。