representation-dynamics

标签

Cards List
#representation-dynamics

层表示动力学:跨嵌入器和基础大语言模型的实证研究

arXiv cs.LG · 2026-05-14 缓存

本文引入了层表示动力学(LRD),这是一个包含三个测量家族的框架,用于分析语言模型中各层隐藏状态的变化。应用于30个MTEB任务上的31个模型,LRD揭示了架构差异,并实现了无标签模型选择和推理时层剪枝。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈