llm-control

标签

Cards List
#llm-control

你的LLM何时可引导?

arXiv cs.CL · 昨天 缓存

本文通过分析早期解码动态,研究了激活引导在LLM上何时成功或失败。作者引入了ASTEER,这是一个包含大量引导生成结果的大型测试平台,并训练了一个GBDT分类器,通过早期隐藏状态预测引导结果,从而实现高效的引导强度搜索。

0 人收藏 0 人点赞
#llm-control

何时Rank-1引导是廉价的?几何、粒度和预算搜索

arXiv cs.LG · 2026-05-19 缓存

本文研究了秩1激活引导在何时有效且具成本效益,提出了几何引导搜索和粒度的概念来解释变异性,并引入了GRACE框架用于高效的大语言模型控制。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈