eigendecomposition

标签

Cards List
#eigendecomposition

@rasbt:总是回到基础:LatentMoE 可能受 MLA 启发,MLA 受 LoRA 启发,LoRA 受 SV…启发

X AI KOLs Timeline · 2026-06-09 缓存

Sebastian Raschka 指出,从 LatentMoE 到特征分解的灵感链:MLA、LoRA 和 SVD 层层启发。

0 人收藏 0 人点赞
#eigendecomposition

Transformer 残差流的动力学:谱几何与网络拓扑的耦合

arXiv cs.LG · 2026-05-15 缓存

本文对生产规模的大型语言模型进行了完整的 Jacobian 特征分解,揭示了从旋转主导的早期层到对称后期层的习得谱梯度,以及一个压缩扰动的低秩瓶颈。结果将扰动传播与压缩与网络功能拓扑联系起来。

0 人收藏 0 人点赞
#eigendecomposition

时隔8年,我重写了我的开源PyTorch曲率库

Hacker News Top · 2026-05-14 缓存

时隔8年,作者重写了开源库pytorch-hessian-eigenthings,利用Lanczos等迭代方法为PyTorch模型提供Hessian及其他曲率矩阵的高效特征分解。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈