标签
介绍轨迹外推误差,这是一种从变换器语言模型隐藏状态导出的度量,它独立于惊讶度且与其正交地预测人类阅读时间,揭示了增量处理成本中一个可分离的成分。
研究者通过探针语言模型表征,在五种语言中预测人类阅读时间,发现早期层在早期眼动指标上优于惊讶度,而惊讶度在晚期指标上仍占上风。