confidence-trajectory

标签

Cards List
#confidence-trajectory

HyperLens:利用细粒度置信度轨迹量化大型语言模型的认知努力

arXiv cs.AI · 2026-05-08 缓存

本文介绍了 HyperLens,一种高分辨率探针,可通过追踪层间的细粒度置信度轨迹来量化大型语言模型(LLMs)的认知努力。研究表明,复杂任务需要更高的认知努力,并展示了监督微调(SFT)如何降低这种努力,从而可能导致性能下降。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈