标签
本文追踪了使用不同学习规则(反向传播、反馈对齐、预测编码、STDP)的监督训练如何降低神经网络表征与早期视觉皮层fMRI数据之间的对齐度,发现未训练的网络在V1对齐度上通常达到或超过训练后的网络。
本文通过考察来自8个家族的16个语言模型在800个推理问题上的表现,探究了Platonic Representation Hypothesis。研究发现,虽然模型在内部表征上趋于一致,但在推理过程中,尤其是决策后阶段,它们出现分歧,而且共享的表征对预测的因果影响极小。