标签
介绍了NEO,一种从点云预测低频拉普拉斯-贝尔特拉米特征空间的神经框架,通过质量感知神经算子和Rayleigh-Ritz精化,实现近线性扩展和强大的零样本泛化能力。
本文对生产规模的大型语言模型进行了完整的 Jacobian 特征分解,揭示了从旋转主导的早期层到对称后期层的习得谱梯度,以及一个压缩扰动的低秩瓶颈。结果将扰动传播与压缩与网络功能拓扑联系起来。