hidden-states

标签

Cards List
#hidden-states

视觉-语言模型中可靠性的所在:注意力、隐藏状态与因果电路的机制研究

arXiv cs.AI · 2天前 缓存

本文通过证明注意力图的尖锐度并非视觉-语言模型正确性的良好预测指标,挑战了“注意力-置信度假设”。相反,研究表明,隐藏状态的几何特征和自一致性更能反映模型的可靠性,并揭示了晚期融合模型与早期融合模型在架构上的显著差异。

0 人收藏 0 人点赞
#hidden-states

LLM代理已经知道何时调用工具——甚至无需推理

Hugging Face Daily Papers · 4天前 缓存

本文介绍了When2Tool,一个研究LLM代理实际何时需要调用工具的基准,并揭示模型已从隐藏状态知道工具的必要性但未能采取行动。提出的Probe&Prefill方法将不必要的工具调用减少了48%,且精度损失极小。

0 人收藏 0 人点赞
#hidden-states

@rohanpaul_ai: 冻结的LLM在其隐藏状态深处仍携带可读的行为信号。Proprioceptive AI已创建了Cy…

X AI KOLs Following · 6天前

Proprioceptive AI发布了Cygnus,这是一款为冻结的LLM配备自感知适配器的工具,通过gl(4,R)李代数读取内部隐藏状态以隔离暗模式,将Qwen-32B在ARC-Challenge上的分数从82.2%提升到94.97%,仅使用一张RTX 3090且无需重新训练。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈