spectral-analysis

标签

Cards List
#spectral-analysis

秩不等于容量:潜在图模型的光谱占用分析

arXiv cs.LG · 18小时前 缓存

本文提出了一种名为 Spectra 的方法,利用光谱占用率来分析和控制潜在图模型的实际容量,并论证了模型的秩并不等同于其容量。

0 人收藏 0 人点赞
#spectral-analysis

我发现Transformer中一个预测几何稳定性的隐藏比率 [R]

Reddit r/MachineLearning · 昨天

本文通过Lyapunov谱分析发现,MLP和注意力谱范数之间的比率能够预测Transformer模型的几何稳定性,最优范围在0.5–2之间,可防止秩坍缩。

0 人收藏 0 人点赞
#spectral-analysis

用于定位 Grokking 相变的分布谱诊断方法

arXiv cs.LG · 昨天 缓存

本文提出了一种分布谱诊断方法,用于在测试准确率上升之前定位 Transformer 模型中的 Grokking 相变。该方法利用经验分布和汉克尔动态模态分解(Hankel DMD)创建监测信号,以区分发生 Grokking 和未发生 Grokking 的训练运行。

0 人收藏 0 人点赞
#spectral-analysis

Sol Star System 高精度 HDC 参考仪器

Hacker News Top · 3天前 缓存

一个用于计算星历和光谱数据的 Python 库,托管在 PyPI 上。

0 人收藏 0 人点赞
#spectral-analysis

思维的谱几何:相变、指令反转、Token级动力学与Transformers推理中的完美正确性预测

arXiv cs.LG · 2026-04-20 缓存

对11个大型语言模型的全面谱分析,揭示了Transformers在推理与事实回忆过程中隐层激活空间中的相变现象,发现了七个基本现象,包括谱压缩、指令微调反转以及仅基于谱特性的完美正确性预测(AUC=1.0)。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈