transformer-language-models

标签

Cards List
#transformer-language-models

表示能力:Transformer语言模型中特征表示的几何限制

arXiv cs.LG · 昨天 缓存

本文基于线性表示和叠加假设,引入了一个定量框架,用于估计Transformer语言模型的潜在空间能够支持多少近似正交的方向。作者将表示能力定义为可区分特征的上限,并表明它对允许的正交偏差呈指数敏感,且更大的模型倾向于更严格的约束。

0 人收藏 0 人点赞
#transformer-language-models

从相关性到因果性:Transformer语言模型中特征分析的五阶段方法论

arXiv cs.CL · 2026-05-22 缓存

本文提出了一种用于Transformer语言模型中因果特征分析的五阶段方法论,并在GPT-2 small上针对IOI任务进行了演示。研究发现特征具有特定的因果性但并非必要,并揭示了检测鲁棒性与因果鲁棒性之间的差距。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈