标签
本文引入几何稳定性作为衡量刺激对间距离在多次试验中重现可靠性的指标,展示了其在大脑各区域的行为相关性与回路依赖性,并通过吸引子网络模型解释其产生机制。
本文通过Lyapunov谱分析发现,MLP和注意力谱范数之间的比率能够预测Transformer模型的几何稳定性,最优范围在0.5–2之间,可防止秩坍缩。