标签
本文通过机械可解释性解释了为什么使用相同编码器、数据和损失微调的作者身份归属模型,其性能可能因评分机制不同而相差四倍。研究发现,评分器决定了编码器在何处整合作者身份信号:平均池化迫使早期整合,而延迟交互则允许后期整合。